![]() |
![]() |
Accueil > Le blog des moteurs de recherche et du référencement > Moteurs : un Web de retard ? Le but de ce blog est de poser un certain nombre de questions sur les moteurs de recherche et le référencement et de susciter le débat sur ces interrogations*. Dans ce cadre, je parlais dans l'un de mes précédents posts du fait que les éditeurs et web-agency ne prenaient pas en compte les contraintes des moteurs de recherche dans leur processus de création de site. Un lecteur faisait remarquer avec raison, dans son commentaire, que l'inverse pouvait également être vrai : pourquoi les moteurs ne s'adaptent-ils pas à la réalité de la création de sites en indexant le format Flash, en suivant les liens JavaScript, etc.Cela m'a fait penser qu'effectivement, les moteurs de recherche, depuis leur création, accusent un retard d'environ deux ans entre la façon dont ils indexent les sites et la manière dont ces derniers sont créés. Il y a quelques années de cela, la "norme" était de créer des sites web avec des "frames" (ou cadres). Et certains moteurs, comme Excite, refusaient purement et simplement ce type de site. Les autres les indexaient mal. Puis est venu l'époque des sites dynamiques, dont les urls "exotiques" affichaient moult point d'interrogation, esperluettes et autres caractères synonymes de passage de paramètres qui rendaient l'indexation difficile voire impossible. Aujourd'hui, les sites avec frames ne posent plus vraiment de problèmes à partir du moment où le nécessaire a été fait pour leur référencement. La problématique des sites dynamiques est en voie d'être résolue car les urls "exotiques" sont mieux comprises. D'autre part, les système de réécriture d'url permettent également d'obtenir une situation plus "propre"... Mais depuis plusieurs années, le format Flash et la langage JavaScript sont devenus des standards de fait dans la création de site. Et ils posent toujours des problèmes aux moteurs. Est-ce réellement normal ? Pourtant, Macromedia, inventeur du Flash, propose un SDK (Software Development Kit) pour les moteurs de recherche, permettant à ces derniers d'indexer les contenu des animations créées. Rien n'empêche vraiment les Google et consorts de s'en servir pour mieux indexer ce format. D'autre part, le fait que des robots sachent suivre des liens écrits en JavaScript ne doit pas non plus être insurmontable lorsqu'on résoud au quotidien des problèmes bien plus importants de volume de données, d'algorithme de pertinence pointu ou autres problématiques réseau... Alors, qu'est-ce qui fait que les moteurs ont le plus souvent ces deux ans de retard sur les standards de fait de la création de site web ? Difficile de le dire... Mais Google, dont l'un des credos est de "rendre accessibles et utiles les informations du réseau mondial à tous les internautes" ne faillit-il pas à sa mission en "comprenant" mal ces "nouveaux" - le terme n'est que relatif - formats ? Il en est d'ailleurs de même des autres moteurs... Avant de chercher à indexer les vidéos, les blogs, la musique, et tous les autres formats de cette planète, ne faudrait-il pas s'attacher à une plus grande exhaustivité de l'indexation web ? Ou les moteurs désirent-ils avant tout dicter leurs propres "lois" de création de site ? Il est certain que si les web-agencies ne tiennent pas compte des contraintes actuelles des moteurs et que ces derniers ne font pas de gros efforts pour indexer les formats en cours, la situation a peu de chance d'évoluer rapidement. C'est certainement aux deux parties de faire un effort conjoint... A l'heure où on nous parle à tout va du Web 2.0, jusqu'à quand les moteurs en resteront-ils à sa version 1.0 ? L'avenir le dira certainement... * J'en profite d'ailleurs pour remercier les lecteurs de ce blog pour leurs commentaires, le plus souvent - et à de rares exceptions près - très constructifs, argumentés et intéressants... Bookmarker dans :
<< Accueil
Accueil > Le blog des moteurs de recherche et du référencement > Un Ministre Présidentiable ou Une Malhabile Promotion ?L'UMP a encore fait parler de lui dernièrement dans le domaine des liens sponsorisés en achetant un certain nombre de mots clés sur Google au travers de l'offre de liens sponsorisés AdWords. Il a également lancé un e-mailing dernièrement. Nous en reparlerons plus loin dans ce post... Des Banlieues à Mahomet en passant par Outreau L'UMP a par exemple acheté l'expression "caricatures mahomet" sur Google. Mais aussi "outreau" et bien d'autres... Chacun se fera son opinion sur ce type de promotion. Mais au moins, on peut remarquer que le parti politique n'a pas refait la bourde de "banlieues", il y a quelques semaines de cela et a pris l'option "phrase exacte" pour l'expression "caricatures mahomet"... Ca évite à l'UMP de sortir sur des requêtes comme "Mahomet terroriste" ou "fatwa sur les caricatures"... Comme quoi, on apprend tous les jours de ses anciennes erreurs... Des noms propres et des achats douteux... Plus difficile à digérer, à mon avis, est l'achat de mots clés comme "Jack Lang", "Robert Hue", "Lionel Jospin", "Ségolène Royal", "Dominique Strauss-Kahn", "parti socialiste", "Assemblée Nationale" et bien d'autres (dont on trouve une liste quasi exhaustive en quelques minutes sur la blogosphère), n'ayant qu'un rapport très lointain avec l'UMP et ceci sans l'accord, sauf erreur de ma part, des personnes et partis en question... Cela m'a interloqué, en tant que citoyen que j'espère responsable, que le parti politique d'une personne qui sera, si j'ai bien tout compris, candidat à la présidence de la République française, se permette ce type de manoeuvre... Etait-ce vraiment légal ? En tout cas, je voyais mal un futur candidat à l'élection présidentielle agir dans l'illégalité avant même de se présenter... J'ai donc demandé à Murielle Cahen (http://www.murielle-cahen.com/), avocate spécialisée dans les NTIC, de me dire ce qu'il en était. Voici sa réponse : "L'UMP a acheté plusieurs mots clefs correspondant à des noms de personnalités sur le système publicitaire de Google "Adwords" (dont des noms de personnalités de l'opposition tel que Jack Lang...) dans le but de gonfler l'audience de ses sites. Cependant, le nom patronymique se révélant être un attribut de la personnalité tout à la fois immuable, indisponible et imprescriptible, il est protégé en droit français contre une éventuelle exploitation commerciale sans l'accord de la personnalité considérée. En effet, l'exploitation non autorisée d'un nom patronymique à des fins commerciales constitue une atteinte au droit au nom, chaque individu disposant d'un monopole d'exploitation sur celui-ci. Il s'agit d'un droit extrapatrimonial, c'est-à-dire d'un droit subjectif qui n'entre pas directement dans le patrimoine, et qui par conséquent n'entre pas dans le commerce juridique, mais qui trouve cependant sa protection dans des principes généraux du droit et plus particulièrement dans le fait que chacun ait le droit au respect de sa vie privée (article 9 du code civil). La protection contre l'atteinte au nom patronymique est donc proche de celle contre l'atteinte à l'image. Cependant, une telle protection ne saurait être accordée qu'en cas d'usurpation ou d'exploitation commerciale non autorisée, le nom patronymique échappant sinon de part sa nature à la sphère de la vie privée (Paris 30 octobre 1998). En tout état de cause, une atteinte telle que celle portée par l'UMP ouvre très certainement un droit à réparation des personnalités considérées dont le nom a été utilisé dans un but commercial, sans leur autorisation, sur la base d'une responsabilité délictuelle (articles 1382 et 1383 du Code civil). Encore faut-il que ces personnalités rapportent la preuve du préjudice qu'elles ont eu à subir du fait de l'exploitation non autorisée de leur nom, préjudice dont l'importance ne sera certainement pas identique selon leurs différents degrés de notoriété ou d'appartenance politique desdites personnalités." Bref, il semblerait que la manoeuvre soit pour le moins déplacée au regard du droit français (elle l'était de toutes façons, à mon avis, d'un strict point de vue éthique). A priori, pour l'instant, seul Jack Lang a clairement parlé de piratage sur son blog. Les autres ne sont peut-être pas encore au courant... A ce sujet, il semblerait que de plus en plus de personnes, d'associations et d'organismes se fédèrent pour faire en sorte que ces liens coûtent le plus cher possible à l'UMP. On commence ainsi à voir fleurir de nombreuses initiatives d'augmentation artificielle de l'enchère sur certains mots clés et des bataillons de cliqueurs fous s'en donner à coeur joie pour "punir" le parti politique de ce type de promotion... D'autres intiatives sont également en cours. On ne m'enlèvera pas de l'idée que c'est quand même triste d'en arriver là et que de telles méthodes, des deux côtés, discréditent encore plus le système - pourtant efficace - des liens sponsorisés. Personne, réellement, n'a à y gagner... Un e-mailing à source opaque... Troisième initiative de promotion de l'UMP avec un e-mailing, reçu il y a quelques jours de cela sur une adresse e-mail perso. Surprise de ma part car je n'utilise absolument pas cette adresse qui n'est présente que dans le code HTML d'une page d'un de mes sites web, dans le cadre d'un formulaire de demande de renseignement. Donc si quelqu'un utilise cette adresse e-mail, c'est qu'il l'a "aspirée" sur mon site en utilisant un logiciel adéquat (il en existe - hélas - de nombreux). Mais ce qui est sûr, c'est que je n'ai jamais donné mon accord pour recevoir une quelconque publicité ou un e-mailing sur cette adresse... Bref, en bas du mail reçu, se trouvait le message suivant : "Vous avez un droit d'accès aux informations personnelles vous concernant en contactant Axipub à contact@ax92.com". Ah ben tiens, ça tombe bien, c'est justement ce que je voulais faire... J'écris donc à cette adresse en demandant ce qu'il en est. Rapidement, dans la journée, je reçois la réponse suivante : "Bonjour, Vous avez reçu ce message car vous êtes inscrit sur la liste de diffusion suivante gérée par PopList : Lettre d'information Vivrelacampagne.fr http://www.vivrelacampagne.fr. L'envoi de messages promotionnels pour nos partenaires fait partie de nos conditions générales d'utilisation que vous avez accepté lors de votre inscription à la liste ci-dessus, et nous permet de vous envoyer les newsletter de ce site (...)." J'avoue être assez étonné car je n'ai jamais entendu parler de près ou de loin de la "Lettre d'information Vivrelacampagne.fr" et encore moins donné d'accord pour recevoir des "messages promotionnels" de la part de ses partenaires... Intrigué, j'envoie un mail au webmaster du site Vivrelacampagne.fr en lui demandant plus d'informations. Sa réponse est, là aussi, rapide : "J'accuse réception de votre e-mail et je m'empresse d'y répondre pour vous dire que je fais une enquête de mon côté car votre adresse n'est pas enregistrée dans nos services en qualité d'abonné à notre lettre d'informations www.vivrelacampagne.fr"... Ben, alors, ils m'ont raconté des bananes, à l'UMP ? Je leur renvoie donc un message pour leur demander des éclairages, en fournissant la réponse du webmaster pré-cité. Et bien, croyez-le ou non, mais j'attends toujoours la réponse... Ben, pour ce qui est du "droit d'accès aux informations personnelles me concernant", je peux toujours courir... Est-ce vraiment sérieux ? Est-ce réellement légal ? A chacun de se faire son idée... Moi, j'avoue être assez dégoûté de ce type de pratiques et je me demande parfois si le Web français est bien professionnel... Allez, à la prochaine avec un post qui sera, je l'espère, un peu plus optimiste... Je sais pas pourquoi, ça doit être la pluie qui tombe dehors, mais ça me fout le cafard tout ça... :-( Bookmarker dans :
<< Accueil
Accueil > Le blog des moteurs de recherche et du référencement > Vers une (r)évolution culturelle du référencement ? Le petit monde du référencement en France est en émoi après l'annonce de la mise en liste noire du site de BMW en Allemagne par Google. Pourtant, on ne peut pas dire que cela surprendra beaucoup de monde, puisque ce type de "grandes manoeuvres antispam" était prévu de longue date par le moteur. Relisez les posts suivants sur ce blog pour vous en persuader : Les pages satellites bientôt sur orbite, Webdesign et Référencement, Google, SEO et ses bas, etc.Google semble combattre le spam sur des sites allemands actuellement (BMW, Ricoh et d'autres). Selon mes informations, des actions seront très bientôt entreprises par Google contre bon nombre de sites disponibles en langue française dans le courant du premier semestre 2006. De nombreux sites devraient donc être bannis de l'index du moteur ou "simplement" déclassés sur certaines requêtes très concurrentielles (les observateurs aguerris auront d'ailleurs remarqué que ce "ménage" a déjà commencé sur certains mots clés...). Tout cela me fait à nouveau penser à la façon, que je juge catastrophique, dont les propriétaires, les éditeurs et les créateurs de sites web prennent (ou plutôt ne prennent pas) en compte les contraintes dûes aux moteurs de recherche lors de la mise en place de leurs pages.... Imaginez... Imaginez un éditeur de livres sortant des ouvrages dont le format (hauteur, largeur) fait en sorte qu'il ne rentre pas dans les étagères des librairies et des grandes surfaces comme la Fnac ou Virgin. Un autre éditeur, plus petit, aura, lui, eu l'idée de venir dans ces magasins, de mesurer la taille des étagères et d'adapter ses couvertures (format, mais aussi couleur, typos, etc. en fonction des différents rayons et des autres livres présentés) à celles-ci. Résultat : il est mieux trouvé et vend plus que son gros concurrent dont les livres s'entassent dans un coin pour incompatibilité de format... Voici, en quelques mots à peine caricaturés, la situation du référencement de sites web en France : des sites créés à coup de dizaines de milliers d'euros, voire plus, ne tiennent absolument pas compte des contraintes des moteurs de recherche (titres mal écrits - lorsqu'ils existent -, peu de texte, mauvaise utilisation du JavaScript, Flash à gogo, etc.) et les éditeurs râlent ensuite parce que, dans les pages de résultats des moteurs, ce sont des sites de PME qui leur passent devant... Mais qu'y a-t-il de plus normal à cela ? Ces sites ont juste fait ce qu'il fallait pour être bien optimisés, et donc plus visibles... Résultat : le site de l'éditeur mécontent n'ayant certainement pas coûté assez cher, on rajoute une couche de budget pour le référencement et, comme personne ne veut plus toucher aux pages déjà en ligne, on créé des pages satellites qui, la pression du client aidant, frôle de plus en plus la limite de ce qui est autorisé par les moteurs de recherche jusqu'à tomber dans les oubliettes... Je sais, je caricature, mais on m'a déjà raconté tellement de choses à ce sujet que je ne suis pas sûr de pousser le bouchon si loin que cela... Qui est fautif dans cette histoire ? Le référenceur qui est allé trop loin dans la création de ses pages satellites ? La web-agency qui n'a pas voulu (ou pu ou su) intégrer les contraintes des moteurs de recherche au site créé pour son client ? Le propriétaire du site qui n'a pas voulu (ou compris la nécessité de) toucher à son site pour l'optimiser ? Les fautes sont certainement partagées et il n'est pas dans ma volonté de jeter l'opprobe sur un corps de métier en particulier... Il serait trop facile de tirer à bout portant sur les sociétés de référencement aujourd'hui alors que, la plupart du temps, elles ne font que s'adapter à un marché, à une demande... Après tout, les entreprises spécialisées qui ont fait des pages satellites leur fond de commerce sont plutôt rares (même si ce ne sont pas toujours les plus petites). Ne nous y trompons pas : la majorité des sociétés de référencement en France n'utilise pas les pages satellites comme système de référencement / positionnement et basent plutôt leur stratégie sur le conseil et l'optimisation des pages existantes du site. Là est la véritable voie de réflexion pour l'avenir... En revanche, les entreprises orientées "pages satellites" devraient clairement et très rapidement réfléchir à leur avenir et à leurs méthodologies avant qu'il ne soit trop tard... Disons-le clairement : la page satellite (ou "fantôme", ou "alias", ou "doorway" ou tout autre nom similaire) est une technologie qui peut aujourd'hui être considérée comme obsolète, voire dangereuse. Elle DOIT être abandonnée ! Mais pour cela, il faut absolument que tous les acteurs de la chaîne de la création de site web soient clairement persuadés que chacun doit et peut avancer dans le même sens : - Le propriétaire d'un site web doit être conscient que, pour obtenir une bonne visibilité sur les moteurs de recherche, certaines concessions, notamment techniques, doivent être faites. - Le créateur du site web (web agency) doit être formé aux techniques d'optimisation de site et conseiller, en partenariat avec le référenceur, le client sur ce qui est possible et ce qui ne l'est pas. - Le référenceur doit garantir la non utilisation de pages satellites ou d'autres procédés aujourd'hui clairement refusés et interdits par les moteurs de recherche. Il est possible d'obtenir une excellente visibilité sur un moteur de recherche en mettant en place une optimisation "propre", loyale, honnête et pérenne, et sans artifice ni "rustine" à durée de vie limitée... Le tout est surtout de partir d'une base la plus "saine" possible, c'est-à-dire d'un site web préparé dès le départ pour le référencement... Alors, si tout le monde y met du sien (et pourquoi, dans ce sens, les moteurs de recherche ne se joindraient-ils pas au cortège ?), peut-être évitera-t-on le type de problème qu'on voit apparaître aujourd'hui avec le blacklistage d'un site comme celui de BMW Allemagne... Mais cela passera nécessairement par une "révolution culturelle" et la remise en question d'une certaine approche du référencement. Les sociétés françaises qui se sont perdues dans la voie de la page satellite sont-elles prêtes à cette révolution qui n'est peut-être d'ailleurs qu'une évolution ? L'avenir le dira... Bookmarker dans :
<< Accueil
Accueil > Le blog des moteurs de recherche et du référencement > Abondance de pages nuit parfois... Depuis de très nombreuses années et quasiment depuis que les moteurs de recherche existent, je lis des études menées sur une donnée très répandue, à savoir le nombre de résultats retournés par les moteurs de recherche.En effet, lorsque vous saisissez une requête dans le formulaire de recherche d'un moteur, ce dernier vous indique, sur sa page de résultats, le nombre de documents qui répondent à cette demande. Or, historiquement, il a le plus souvent été admis que cette indication n'était fournie que de façon approximative (notez, d'ailleurs, le "environ" utilisé par Google et Yahoo!) et, il faut bien le dire, parfois très farfelue... Cette raison fait qu'il me semble réellement difficile de se baser sur cette donnée pour mettre en place des études savantes la prenant en compte, car ces travaux seraient immanquablement bâtis sur du sable, les informations de départ n'étant pas fiables. Je me souviens même d'une époque où le nombre retourné par un moteur de recherche majeur (mais dont l'aura a quelque peu décliné depuis) était à la limite de l'aléatoirité... Nous n'en sommes, heureusement, plus là aujourd'hui, ceci dit, on cotoie parfois quand même le "grand n'importe quoi" sur la plupart des moteurs actuels à ce sujet (même si certains semblent plus fiables que d'autres)... Ce qui me gène, c'est que je ne comprends pas pourquoi les moteurs ne fournissent pas une donnée exacte... Bien sûr, certains argumenteront sur le fait que la plupart des moteurs limitent le nombre maximal de résultats affichés (1 000 pour Google) pour une requête donnée et que, après tout, si ce nombre global est de 6 ou 7 millions, quelle importance cela peut-il avoir, puisqu'on ne peut pas voir tous résultats ? Certes, mais est-ce une raison pour ne pas bien faire son travail ? Cette approximation peut, à mon avis, venir de deux raisons fondamentales : - Des raisons techniques, les moteurs préférant garder de la "charge machine" pour d'autres tâches plus importantes. Si cet argument tient pour des requêtes complexes, contenant de nombreux mots clés ou utilisant une syntaxe avancée (site:, link:, etc.), le fonctionnement interne d'un moteur de recherche, sur la base d'index inversés*, devrait faire en sorte que sur des mots clés génériques, ou sur des requêtes à un seul terme, un nombre exact de résultats devrait être disponible "sans effort". Ce qui n'est pas le cas. - Des raisons concurrentielles, les moteurs fournissant un nombre de résultats supérieur à celui de leurs concurrents, sur la base d'un benchmark effectué au préalable. La course au plus gros index peut rendre fou :-) Peu probable, mais après tout, pourquoi pas ? Bref, l'inexactitude parfois flagrante de cette donnée retournée par les moteurs de recherche reste un mystère pour moi. Pourquoi oeuvrer à une pertinence toujours meilleure et, en même temps, retourner une info parfois très éloignée de la vérité en ce qui concerne le nombre de résultats identifiés ? Si quelqu'un peut m'aider dans mes réflexions, je suis preneur... :-) * Les abonnés à la lettre "Recherche & Référencement" du site Abondance pourront se référer à l'article "Comment fonctionne un moteur de recherche ?" du mois de mars 2005 à ce sujet. Bookmarker dans :
<< Accueil |
Quelques réflexions sur les moteurs de recherche et le référencement, infos sur le référencement à destination des webmasters, études, enquêtes sur les moteurs de recherche, etc.
Liens sponsorisés
Messages précédentsArchives
Lettres d'actualité
L'actu des moteurs
Liens
|
| Un site du Réseau Abondance (english version : Search Engine Tools) : |
|
Information : Abondance
- Forums
Abondance - Boutique
Abondance - Livre
Référencement - Livre
Google Outils : Outiref - Visiref - Keyword Search Engine - Spider Simulator - Soumission-Manuelle - Flash Moteurs - Moklic Divers / Jeux : Googlefight - Habitants - Googland - Grifil.com Moteurs de recherche : Mozbot.fr - Mozbot.com - Mozbot.co.uk - Goossip - Motref - Rugby engine - Grifil.net - Biomalin - Foot Engine - SearchWings |