13 septembre 2006 


Accueil > Le blog des moteurs de recherche et du référencement >

Google, à l'exploration du cortex numérique...


Google a lancé dernièrement un applicatif nommé News Archive Search, permettant l'exploration historique de l'actualité sur les 200 dernières années. Un applicatif extrêmement intéressant pour qui recherche une information dans le passé historique.

Dans le même sens, je me suis toujours posé la question sur le sort donné par Google aux pages web qu'il indexe jour après jour. Lorsqu'un document disparaît du Web, le moteur l'enlève, de façon logique, de l'index disponible aux internautes, mais qu'en fait-il ? En garde-t-il une trace ? Idem pour l'ancienne version d'une page web... Lorsque les spiders de Google identifient la mise à jour d'un document, qu'advient-il de l'ancienne version ? Est-elle écrasée ou sauvegardée "quelque part" en attendant ?

Imaginez que, depuis 1999, date de création de Google, le moteur ait sauvegardé TOUTES les pages, toutes les différentes versions des documents identifiés sur le Web, un peu comme une Wayback Machine puissance 10... Quelle extraordinaire outil cela serait... Il permettrait de plonger dans les entrailles du Web sur sept ans et d'identifier des monceaux de pages parfois oubliées... Bien sûr, on peut imaginer que, juridiquement parlant, cela pose un certain nombre de questions... Bien sûr,on peut imaginer que la masse d'informations stockée est monstrueuse (il serait intéressant d'ailleurs de faire un sondage à ce sujet : quelle est, selon vous , la taille du web en termes de milliards de pages différentes mises en ligne et de tera-octets, depuis sept ans ?) mais on peut toujours rêver non ?

Alors, Google garde-t-il tout ou jette-t-il les informations au fur et à mesure ? Personnellement, j'ai l'intime conviction que la première version est la bonne et qu'il pourrait un jour ou l'autre proposer un service décoiffant nous permettant d'explorer le cortex mémorial de notre planète web depuis de nombreuses années...

Bookmarker dans : Scoopeo | Del.icio.us | Digg | Autres :   AddThis Social Bookmark Button

 

4 Commentaire(s) :

Rappelons ici que les liens insérés dans vos commentaires sont en 'rel=nofollow' et ne sont donc ni suivis ni interprétés par les moteurs de recherche...

Les têtes pensantes de Google ne laissant rien au hasard, je penche également pour la première possibilité. Cela irait dans le sens de beaucoup d'autres services qu'ils proposent (barre Google, Analytics, pour n'en citer que quelques uns) et qui ont pour ambition (à peine cachée) de leur fournir une connaissance empirique du web.
Google, base de connaissance du web passé, présent et évidemment futur... ça laisse pensif, non ?

Bonjour,
Idem, 1ère option pondérée par le rachat de ce qui pourrait manquer des débuts et de l'avant Google (à suivre dans les acquisitions).

Question stockage, en route pour le Google Octets !

Nous avons constaté que, lorsque nous effacons le nom d'une personne d'un décret ou d'un arrêté (à la demande de l'intéressé) sur le site admi.net, et que nous demandons la réindexation d'urgence par google, il arrive que 6 mois plus tard la page réapparaisse subitement dans sa forme antérieure dans le cache et dans les index de google. Inquiétant, non ?

Utilisant le web depuis une décennie, je penche pour une solution "intermédiaire" ! Google a les capacités ms pas la volonté de tout sauvegarder... Ce serait amusant de retrouver les pages des abonnements des FAI des années 1996-98 ?

Poster un nouveau commentaire


 
<< Accueil
 

 


Quelques réflexions sur les moteurs de recherche et le référencement, infos sur le référencement à destination des webmasters, études, enquêtes sur les moteurs de recherche, etc.
 
feed xml
 
Lettre d'actualité
La lettre "Actu Moteurs" est hebdomadaire et gratuite. Abonnez-vous :

Rejoignez nos 70 000 abonnés (plus d'infos) depuis 1998 et recevez toute l'info sur les moteurs chaque semaine !

 
Les blogs d'Abondance
Abondance-Actu :
Toute l'actualité quotidienne des moteurs de recherche et du référencement.
Abondance-Info :
Quelques réflexions sur les moteurs de recherche et le référencement.
Abondance-Pro :
Le sommaire de la lettre professionnelle "Recherche et Référencement".
Abondance-Abonnés :
Le blog des abonnés payants.
 


http://www.wikio.fr
 

 
 Recherche sur le site Abondance :

Tout Abondance
Toute l'actu depuis 1998

 

Liens sponsorisés

 


 

Messages précédents

 
Soyons fou !
So long, Danny !
Le cimétière des éléphants
De la liste noire unique à la liste grise commune
France-Portugal : ça commence plutôt bien...
Les 400 coups d'Actu... Moteurs !
Circulez, y a (toujours) rien à voir !
Quel modèle économique pour le Search 2.0 ?
Je Veux Aider... à l'optimisation des sites web !
Octobre 2007 : Google maître du monde !

 

Archives

 
septembre 2005
octobre 2005
novembre 2005
décembre 2005
janvier 2006
février 2006
mars 2006
avril 2006
mai 2006
juin 2006
juillet 2006
août 2006
septembre 2006
octobre 2006
novembre 2006
décembre 2006
janvier 2007
février 2007
mars 2007
avril 2007
mai 2007
juin 2007
juillet 2007
août 2007
septembre 2007
octobre 2007
novembre 2007
décembre 2007
janvier 2008
février 2008
mars 2008
avril 2008
mai 2008
juin 2008
juillet 2008
août 2008
septembre 2008
octobre 2008
novembre 2008

Lettres d'actualité

 
Actu Moteurs : revue de presse hebdomadaire
Recherche & Référencement : lettre professionnelle mensuelle

L'actu des moteurs

 


Liens

 
Abondance.com
Réseau Abondance
Autres blogs sur les moteurs

 
Chercher sur le Web avec Mozbot :

Chercher sur :
Web international
Web francophone

 

Un site du Réseau Abondance (english version : Search Engine Tools) :
Information : Abondance - Forums Abondance - Boutique Abondance - Livre Référencement - Livre Google
Outils : Outiref - Visiref - Keyword Search Engine - Spider Simulator - Soumission-Manuelle - Flash Moteurs - Moklic
Divers / Jeux : Googlefight - Klevener - Googland - Grifil.com
Moteurs de recherche : Mozbot.fr - Mozbot.com - Mozbot.co.uk - Goossip - Motref - Rugby engine - Grifil.net - Biomalin - Foot Engine - SearchWings