Recherche sur le site Abondance :

Tout Abondance  Toute l'actu depuis 1998

21 juin 2011 


Duplicate Content Dust et balise canonical - (Questions/réponses avec Google #14)

Le 21 juin 2011  
   

 
Nous continuons notre série de questions/réponses avec Google en abordant un point un peu plus technique dans le domaine du "duplicate content" : le DUST (Duplicate URL, Same Text).

En effet, l'une des différentes formes de "duplicate content" que l'on a à traiter assez souvent en SEO est le DUST : Duplicate URL, Same Text, c'est-à-dire le fait qu'une même page web soit disponible sous plusieurs URL différentes comme :

http://www.votresite.com/
http://www.votresite.com (sans "/")
http://www.votresite.com/index.html
http://www.votresite.com/index.html?param=1
http://www.votresite.com/index.html?sid=08876766RT5
Etc.


Le problème ici est que le moteur voit non plus une seule page, mais autant de pages qu'il existe d'URL.
Ainsi, si une de ces URL a 3 backlinks, l'autre 4, une autre 2, la suivante 3 et la dernière 5, on ne se retrouve pas dans un situation où vous avez une seule page qui hérite de 17 backlinks, mais de 5 pages pour lesquelles les backlinks sont inégalement répartis. Pas super efficace pour votre référencement, notamment sur votre page d'accueil ou des pages populaires de votre site...

Comment, donc, montrer aux moteurs de recherche que toutes ces URL correspondent à une seule et même page web ?

- Dans les Google Webmaster Tools, la zone "Configuration du site > Paramètres > Traitement des paramètres" permet d'indiquer certains paramètres (dans l'exemple ci-dessus : "param" et "sid") que le moteur doit ignorer. C'est une première piste.

- Il doit également être possible, de façon complémentaire, d'indiquer dans le code source de la page, la balise "link rel canonical" sous cette forme :

<link rel="canonical" href="http://www.votresite.com/" />

Ainsi, chaque fois que Google lit une des URL ci-dessus, cette balise lui indique que la page en question est dupliquée de la page canonique qui se trouve à l'adresse http://www.votresite.com/. Comme cette balise transfère également les backlinks depuis les pages dupliquées vers la page canonique, le tour est joué (suis-je assez clair ? C'est un point assez complexe à expliquer...)...

Seul point un peu "bizarre" : lorsque Google lit le code HTML de la page http://www.votresite.com/, il y lit que cette page est dupliquée de la page http://www.votresite.com/, c'est-à-dire d'elle-même. Etrange...

Nous avons donc posé la question au service "Search Quality" de Google : qu'en est-il de cette pratique en cas de DUST ? Est-elle valable ?...

Question Abondance : Imaginons que j'aie une page web affichée à l'adresse :
http://www.monsite.com/boutique/fiche-produit.html
et que cette page soit, par exemple, également disponible sous des URL de type :
http://www.monsite.com/boutique/fiche-produit.html&param=1
(ou &param=1 serait par exemple un élément de tracking ou autre).
Pour éviter tout problème de duplicate content, on peut bien sûr utiliser la partie "gestion des paramètres" des Google Webmaster Tools (GWT) et demander à Google d'ignorer le paramètre ayant pour nom "param" dans les URL, ce qui peut résoudre un certain nombre de problèmes.
Cependant, il peut arriver que les paramètres changent souvent ou qu'il soit, pour d'autres raisons, complexe d'utiliser la gestion des paramètres des GWT (exemple : les URL changent mais pas sous forme de paramètres additionnels).
Dans ce cas, peut-on intégrer dans le code HTML de la page une balise "canonical" sous cette forme :
<link rel="canonical" href="http://www.monsite.com/boutique/fiche-produit.html" />
Ce qui permettrait, quels que soient les paramètres additionnels potentiels ou les autres URL éventuelles, de montrer qu'il s'agit de la même page et du même code HTML...
Est-ce que cela fonctionne ?

 

La réponse de Google : Cette démarche est tout à fait correcte et recommandable.
La balise “canonical” sous la forme
<link rel="canonical" href="http://www.monsite.com/boutique/fiche-produit.html" /> permettra de montrer à Googlebot que toutes les URL qui contiennent cette ligne de code présentent un contenu similaire, et qu'il ne faut pas toutes les indexer.
Il est nécessaire d'ajouter l'élément canonique non seulement dans la version favorite, mais également - et éventuellement - dans toutes les autres versions non canoniques de la page.
Pour en savoir plus, j'engage tes lecteurs à regarder cette petite vidéo de Matt Cutts (et notamment cet extrait) :



Notre commentaire : l'emploi de cette balise fonctionne, ce qui est une bonne chose pour éviter tout problème de "duplicate content" de type "DUST". Attention seulement : à l'heure actuelle, Google News ne lit pas la balise "link rel canonical", cela ne fonctionnera donc pas pour cet outil. En revanche, pour Google Web Search, pas de problèmes.
Notons également que la mention "canonical" peut également être indiquée dans les en-têtes HTTP des pages, cela fonctionnera de la même façon...


Rappel des précédentes Questions à Google :
1. Les underscores dans les URL
2. Web 2.0, Contenu caché et pénalités Google
3. La pondération des liens entrants - ou backlinks
4. Les redirections multiples en cascade
5. Modification de la vitesse de crawl des spiders
6. Référencement et hébergement mutualisé
7. Sitemaps et nombre d'URL indexées
8. Référencement et redirections 301
9. Google prend-il en compte l'attribut Longdesc ?
10. Le nombre de pages d'un site web indexées par Google
11. Mots clés et Google Webmaster Tools
12. Les 3 chiffres dans les URL sont-ils obligatoires pour être indexé dans Google Actualités ?
13. Google et le Content Spinning


 


 

9 Commentaires :

Rappelons ici que les liens insérés dans vos commentaires sont en 'rel=nofollow' et ne sont donc ni suivis ni interprétés par les moteurs de recherche...

Est-ce que cela est aussi valable d'un nom de domaine vers un autre?

EA mon avis oui, il n'y a pas de raison...

Bonjour,

Est-ce que cette technique peut être utilisée pour des URLs identiques, mais l'une avec un / à la fin, et l'autre non :

http://www.monsite.com/
http://www.monsite.com

Merci

Oui tout à fait.
cdt

Bonjour, je me permets de commenter sur ce sujet.
L'utilisation du Tag canonical pour ses 2 URLs avec et sans (/) pour la racine du site n'est pas une utilisation valide.
La réponse vient du protocole HTTP.
Lors d'une requête HTTP pour la racine du site "www.monsite.com" on a par exemple :
GET / HTTP/1.1
Host: www.monsite.com

Donc lors d'une demande à un navigateur (client HTTP) d'accéder à http://www.monsite.com sans le slash, il sait très bien qu'il doit demander la racine (GET / : qui représente la racine)

D'autant plus que cela n'a pas de sens d'utiliser une canonical entre les 2 URL car on ne peut pas ajouter l'élément canonique sur la page favorite puisque les 2 "représentent" la racine.

Cordialement

@Anonym : oui tout à fait, comme http://www.monsite.com/index.html par exemple qui représentera également un cas de DUST...

Bonjour Olivier,
Il me semblait que la balise canonique ne diffusait pas la popularité. Aurait-ce changé ?
Car si elle diffuse les BL, ça doit sous-entendre la popularité qui va avec.

Bonne journée

Bonjour
Oui tout à fait, le PageRank est diffusé au travers de cette balise.
cdt

Bonjour,

S'il y a une redirection depuis l'URL http://monsite.com vers http://www.monsite.com par exemple, cela dispense-t-il du tag canonical?
Vaut-il mieux éviter la redirection et opter pour un duplicate content avec tag canonical?


 
<< Accueil
 

 

Quelques réflexions sur les moteurs de recherche et le référencement, infos sur le référencement à destination des webmasters, études, enquêtes sur les moteurs de recherche, etc.
 
feed xml
 
SEO 2011 : pour ne rien rater de l'actu SEO en 2011
 
Un guide (PDF) de 97 pages qui propose un résumé de ce qui a fait l'année 2011 en termes de SEO, pour être sûr de ne rien avoir raté ces 12 derniers mois au niveau du référencement naturel de votre site web.


Le livre "Réussir son référencement web, édition 2012" (Eyrolles, janvvier 2012) bientôt disponible !
Consultez le site Livre Référencement !

Recherche et Référencement
La lettre professionnelle mensuelle "Recherche et Référencement" pour tout savoir sur les moteurs de recherche. Indispensable pour votre veille !

Les Universités du Référencement
3 jours de formation pour explorer les territoires de la rédaction web, de l'optimisation de sites web pour les moteurs de recherche et du référencement naturel en général...
 
Pour tout savoir sur le DVD "SEO, Optimisez votre Référencement Web" (Elephorm, mars 2011), consultez le site de l'editeur Elephorm !


 
Lettre d'actualité
La lettre "Actu Moteurs" est hebdomadaire et gratuite. Abonnez-vous :

Rejoignez nos 70 000 abonnés (plus d'infos) depuis 1998 et recevez toute l'info sur les moteurs chaque semaine !

 
Les blogs d'Abondance
Abondance-Actu :
Toute l'actualité quotidienne des moteurs de recherche et du référencement.
Abondance-Info :
Quelques réflexions sur les moteurs de recherche et le référencement.
Abondance-Pro :
Le sommaire de la lettre professionnelle "Recherche et Référencement".
Abondance-Abonnés :
Le blog des abonnés payants.
 



 

 
 Recherche sur le site Abondance :

Tout Abondance
Toute l'actu depuis 1998

 

Messages précédents

 
Une Google Car en Lego !
Recherche et Référencement : le numéro 127 de juin...
Bing France : un point 3 mois après son lancement
Universités du Référencement : nouvelle formation,...
Matt Cutts en infographies...
Infographie : la table périodique des signaux SEO
Google et le Content Spinning - (Questions/réponse...
Infographie : SEO et codes HTTP
Une demi-journée pour mieux comprendre Google Pand...
Quelques photos des locaux de Google à Zürich

 

Archives

 
septembre 2005
octobre 2005
novembre 2005
décembre 2005
janvier 2006
février 2006
mars 2006
avril 2006
mai 2006
juin 2006
juillet 2006
août 2006
septembre 2006
octobre 2006
novembre 2006
décembre 2006
janvier 2007
février 2007
mars 2007
avril 2007
mai 2007
juin 2007
juillet 2007
août 2007
septembre 2007
octobre 2007
novembre 2007
décembre 2007
janvier 2008
février 2008
mars 2008
avril 2008
mai 2008
juin 2008
juillet 2008
août 2008
septembre 2008
octobre 2008
novembre 2008
décembre 2008
janvier 2009
février 2009
mars 2009
avril 2009
mai 2009
juin 2009
juillet 2009
août 2009
septembre 2009
octobre 2009
novembre 2009
décembre 2009
janvier 2010
février 2010
mars 2010
avril 2010
mai 2010
juin 2010
juillet 2010
août 2010
septembre 2010
octobre 2010
novembre 2010
décembre 2010
janvier 2011
février 2011
mars 2011
avril 2011
mai 2011
juin 2011
juillet 2011
août 2011
septembre 2011
octobre 2011
novembre 2011
décembre 2011
janvier 2012
février 2012

Lettres d'actualité

 
Actu Moteurs : revue de presse hebdomadaire
Recherche & Référencement : lettre professionnelle mensuelle

L'actu des moteurs

 


Liens

 
Abondance.com
Réseau Abondance
Un site du Réseau Abondance (english version : Search Engine Tools) :
Information : Abondance - Forums Abondance - Boutique Abondance - Livre Référencement - Livre Google
Outils : Outiref - Visiref - Keyword Search Engine - Spider Simulator - Soumission-Manuelle - Flash Moteurs - Moklic
Divers / Jeux : Googlefight - Klevener - Googland - Grifil.com
Moteurs de recherche : Mozbot.fr - Motref - Grifil.net - Biomalin - Foot Engine - SearchWings