Recherche sur le site Abondance :

Tout Abondance  Toute l'actu depuis 1998

26 octobre 2011 


Référencement de sites multilingues et risque de duplicate content - (Questions/réponses avec Google #16)

Le 26 octobre 2011  
   

 
Nous continuons notre série de questions/réponses avec Google en abordant un point dont il est souvent question sur le web et les forums spécialisés, et un question qui nous est souvent posée dans les formations et conférences que nous animons : le référencement de sites multilingues.

En effet, il arrive très souvent qu'un site web mette en ligne des contenus identiques ou similaires, mais dédiés à des pays différents bien que parlant la même langue : France, Belgique, Suisse, Canada (Québec), Afrique, etc. Un contenu mis en ligne sur un site pour les internautes français ne risque-t-il pas, dans ce cas, de créer un conflit de duplicate content avec une autre page, proposant le même contenu éditorial, mais sur le site destiné aux belges francophones, par exemple ? Même chose avec les américains, les anglais et les australiens, etc. Comment faire pour signaler ces informations à Google ?

Nous avons donc posé la question au service "Search Quality" de Google : comment signaler au moteur de recherche certains contenus dédiés à des pays spécifiques tout en évitant le duplicate content ?...

Question Abondance : Je dispose d'un site avec un contenu pour les américains et, sur une autre page, le même contenu pour les australiens et enfin sur une troisième page, un contenu pour les anglais (Grande-Bretagne). Ces contenus sont identiques et, bien sûr, tous dans la même langue. Comment indiquer à Google la cible géographique de ces contenus ? Prenez-vous en compte les balises de géolocalisation (geo.position ou autre) ? Et comment éviter tout problème de duplicate content dans ce cas ?
 

La réponse de Google : Google prend en compte un certain nombre de signaux afin d'identifier l'origine géographique d'un site, comme l'extension (.fr vs .be), ou le lieu d'hébergement du site.
Ces informations peuvent être incomplètes ou non pertinentes, c'est pourquoi il est possible de définir des zones géographiques ciblées dans nos Outils pour les Webmasters.

Prenons un exemple concret :
Une association canadienne propose ses services au Canada, mais également en France et en Belgique. Le site, www.association.org, est hébergé au Canada et dispose donc d'un TLD (.org) générique.
Etant donné que l'extension (en anglais TLD - top level domain) est générique et que le site n'est pas hébergé dans le territoire cible pour la France et la Belgique, il est recommandé d'avertir Google de l'emplacement géographique des utilisateurs que l'on cible, en suivant les étapes suivantes :
- Définir des sections ou sous-domaines spécifiques pour chacun des territoires ciblés (sous-domaines : ca.association.org, be.association.org et fr.association.org, ou répertoires : association.org/ca, association.org/be et association.org/fr).
- Ajouter ces entités dans le compte Outils pour les webmasters.
- Définir la zone géographique ciblée correspondant à chacune de ces entités dans le compte des Outils pour Webmasters (section "Paramètres", puis "Zone géographique ciblée").

Ces informations permettront d'améliorer les résultats des requêtes géographiques sur Google, et complèteront celles que Google aura déjà en sa possession.

Remarques :
- Les sites possédant des extensions nationales (site.fr ou site.be) sont déjà associés à une zone géographique qu'il n'est pas possible de modifier via les Webmaster Tools.
- Il n'est pas conseillé de définir une zone géographique ciblée pour les sites dont l'audience est liée au langage et non au territoire. Il existe des francophones dans de nombreux pays et définir une zone géographique ciblée pourrait restreindre l'audience.
- Si un site est ajouté et vérifié dans les Outils pour les webmasters, ses sections le seront également, tandis que chacun des sous domaines devra être vérifié séparément. Pour reprendre l'exemple, be.association.org devra être vérifié, mais pas association.org/be qui est vérifié par défaut.
- Nous n'utilisons pas les meta tags de localisation (comme "geo.position" ou "distribution") ou des attributs HTML pour géociblage. Alors que ceux-ci peuvent être utiles à d'autres égards, nous avons constaté qu'ils ne sont généralement pas suffisamment fiables à utiliser pour géolocalisation.

Pour ce qui est des problèmes de "duplicate content", les sites multilingues destinés à différentes zones géographiques proposent parfois un contenu identique ou similaire via des URL différentes, et cela ne pose généralement pas de problème lorsque le contenu est destiné à des visiteurs situés dans des pays différents.

Toutefois, nous recommandons vivement de proposer du contenu unique à chaque groupe de visiteurs (par exemple en customisant l'offre du site à l'audience cible, ou en utilisant un vocabulaire adéquat -ex: le Français parle de 'portable', le Belge de 'GSM', et le Suisse de 'natel').

Plus de ressources:
https://sites.google.com/site/webmasterhelpforum/fr/aide-au-referencement/travailler-avec-des-sites-multilingues
https://sites.google.com/site/webmasterhelpforum/fr/aide-au-referencement/sites-web-ciblant-plusieurs-zones-geographiques



Notre commentaire : pour bien référencer un site s'adressant à des internautes habitant dans plusieurs pays, la meilleure solution est certainement d'acheter des TLD spécifiques et alloués à chaque pays. Exemple : le .com pour les Etats-Unis, le .fr pour la France, le .be pour la Belgique, etc. Ensuite, si c'est possible, suffisamment différencier les contenus pour qu'ils ne rentrent pas dans une problématique de duplicate content. Si ce n'est pas possible (et même si ce travail est effectué, d'ailleurs), indiquer dans les Google Webmaster Tools le pays-cible de chaque site.
Si l'achat de plusieurs TLD pose problèmes (de disponibilité par exemple, dans certains pays), vous pouvez opter pour des sous-domaines et effectuer le mêmes manoeuvres que décrites précédemment.
Bon référencement !


Rappel des précédentes Questions à Google :
1. Les underscores dans les URL
2. Web 2.0, Contenu caché et pénalités Google
3. La pondération des liens entrants - ou backlinks
4. Les redirections multiples en cascade
5. Modification de la vitesse de crawl des spiders
6. Référencement et hébergement mutualisé
7. Sitemaps et nombre d'URL indexées
8. Référencement et redirections 301
9. Google prend-il en compte l'attribut Longdesc ?
10. Le nombre de pages d'un site web indexées par Google
11. Mots clés et Google Webmaster Tools
12. Les 3 chiffres dans les URL sont-ils obligatoires pour être indexé dans Google Actualités ?
13. Google et le Content Spinning
14. Duplicate Content Dust et balise canonical
15. Validation HTML/W3C et positionnement Google


 


 

9 Commentaires :

Rappelons ici que les liens insérés dans vos commentaires sont en 'rel=nofollow' et ne sont donc ni suivis ni interprétés par les moteurs de recherche...

Merci pour cet article très intéressant ! On voit bien que Google prend en compte un faisceaux d'indices pour déterminer la zone géographique : la langue, l'extension, l'hébergement... mais on aurait pu citer aussi la monnaie si je suis un site ecommerce, l'adresse postale pour me contacter...

J'ai une question connexe. Mettons que je m'adresse aux entreprises ayant des problématiques à l'international, je vais donc créer un site en anglais avec une extension en .com
Comment Google va déterminer la zone géographique du site puisque mon site s'adresse à tous les pays ?
Merci

Bonjour
J'aurais tendance à dire que si le site s'adresse à tous les pays, il ne s'adresse à aucun en particulier. Il ne sera donc pas mis en valeur dans les résultats du moteur pour un pays particulier. Sauf si le champ adéquat dans les webmaster tools est rempli..
Cdt

Bonjour,
Merci pour cet article.
J'aurai une question cependant, j'ai un site bonjour.fr entièrement en français et donc ciblé d'office par google vers la France. Le site bénéficié d'un très bon référencement.

Afin d'améliorer le site et le compléter j'aimerai lancer des versions dans d'autres langues.

Quelle serai la meilleure solution ?
faire une adresse avec bonjour.fr/en ou faire une adresse hello.com qui redirigerai en faites vers la partie de mon site bonjour.fr/en ?
Est ce que la deuxième solution dérangerai google ?

Votre avis ? j’espère que mon explication est clair :s

Merci et bonne journée, bon WE

@ Fredodo13 : le mieux est de créer un site web hello.com qui ne redirige sur rien, qui est un vrai site à part entière avec un contenu en anglais (la redirection de toutes façons, sera inopérante en termes de SEO).
Ca devrait tres bien se passer :)))
Bien cordialement

lol !
j'aurai du me douter de cette réponse! c'est vrai que s'est la meilleure des solutions le problème c'est qu'il faut référencer dans une langue autre que le FR et donc beaucoup de travail et pas toujours un travail adapter.

1. Il y a apparemment quelque chose que le staff de google ne comprend pas:
Lorsqu'il s'agit d'un site "dont l'audience est liée à la langue et non à un territoire (pays)", google recommande de ne pas définir une zone géographique.
Ce serait parfait ... SAUF que un site est toujours associé, par défaut, à un pays soit par son TLD soit par son lieu d'hébergement. Donc, l'option n'est pas de ne pas définir une zone géographique, mais de garder ou changer le choix de zone par défaut.

2. Pour les sites s'adressant dans une même langue à plusieurs pays avec un même texte, la réponse de google pour éviter problème de duplicate content est de travailler avec des TLD de chaque pays (ou bien avec des sous-domaines ou répertoires géolocalisés).

Je doute que cette solution fonctionne correctement. Et ce cas est précisément visé dans un article tout récent traitant des cas de cross-domain duplicate content où google pourrait ne pas retenir la version voulue:

"Duplicate content, including multi-regional websites: We regularly see webmasters use substantially the same content in the same language on multiple domains, sometimes inadvertently and sometimes to geotarget the content.....".
http://googlewebmastercentral.blogspot.com/2011/10/raising-awareness-of-cross-domain-url.html

Cela ne me donne pas raison, mais montre quand même que la solution envisagée ne fonctonne pas sans possible hiatus.

Bonjour,

j'ai un .com hébergé en Angleterre, j'ai fait une version francaise, disons plutot francophone. Dans Google Webmaster, j'ai déclaré France, que faire pour cibler les belges !

un doublon du site que je déclare dans Google Webmaster, ca me semble totalement ahurissant de devoir faire deux versions !

Merci

Hello Olivier et merci pour cette ressource.

En revanche, je me pose des questions. Selon toi la réponse de Google ne rentre t'elle pas en contradiction avec une annonce, parue sensiblement au même moment que ton billet (peut être même avant) parlant de la déclassification des sous-domaines ?

En d'autres termes, est-il encore possible aujourd'hui de leur faire gober que http://fr.site.tld/ est bien un site à part entière, comparé à en.site.tld/ ?

Parce qu'en l'état leur réponse me semble un peu laconique...

@Loiseau2nuit : je ne me souvient pas d'une annonce officielle de Google indiquant que les sous-domaines seraient déclassifiés (il y a eu une communication sur la prise en compte des sous-domaines dans les webmaster tools, mais c'est un peu différent).
Ceci dit, selon moi, les sous-domaines sont effectivement de moins en moins pris en compte comme des sites à part entière par Google, en effet. Mais rien d'officiel :)
Ceci dit, il est clair pour moi qu'une adresse de type fr.monsite.com donne une indication logistique au moteur, ce qui est une approche diffrente de actu.monsite.com ou blog.monsite.com :)
Cordialement


 
<< Accueil
 

 

Quelques réflexions sur les moteurs de recherche et le référencement, infos sur le référencement à destination des webmasters, études, enquêtes sur les moteurs de recherche, etc.
 
feed xml
 
SEO 2011 : pour ne rien rater de l'actu SEO en 2011
 
Un guide (PDF) de 97 pages qui propose un résumé de ce qui a fait l'année 2011 en termes de SEO, pour être sûr de ne rien avoir raté ces 12 derniers mois au niveau du référencement naturel de votre site web.


Le livre "Réussir son référencement web, édition 2012" (Eyrolles, janvvier 2012) bientôt disponible !
Consultez le site Livre Référencement !

Recherche et Référencement
La lettre professionnelle mensuelle "Recherche et Référencement" pour tout savoir sur les moteurs de recherche. Indispensable pour votre veille !

Les Universités du Référencement
3 jours de formation pour explorer les territoires de la rédaction web, de l'optimisation de sites web pour les moteurs de recherche et du référencement naturel en général...
 
Pour tout savoir sur le DVD "SEO, Optimisez votre Référencement Web" (Elephorm, mars 2011), consultez le site de l'editeur Elephorm !


 
Lettre d'actualité
La lettre "Actu Moteurs" est hebdomadaire et gratuite. Abonnez-vous :

Rejoignez nos 70 000 abonnés (plus d'infos) depuis 1998 et recevez toute l'info sur les moteurs chaque semaine !

 
Les blogs d'Abondance
Abondance-Actu :
Toute l'actualité quotidienne des moteurs de recherche et du référencement.
Abondance-Info :
Quelques réflexions sur les moteurs de recherche et le référencement.
Abondance-Pro :
Le sommaire de la lettre professionnelle "Recherche et Référencement".
Abondance-Abonnés :
Le blog des abonnés payants.
 



 

 
 Recherche sur le site Abondance :

Tout Abondance
Toute l'actu depuis 1998

 

Messages précédents

 
Un mail qui justifie quelques années de travail......
Infographie : Vous cherchez un job chez Google ?
Infographie : SEO et contenu
La Boîte à Outils de l'intelligence économique
Recherche et Référencement : le numéro 130 d'octob...
Infographie : Audit SEO
Universités du Référencement : nouvelle session da...
Les Doodle d'anniversaire de Google
Infographie : évolution des critères de pertinence...
Infographie : Schéma de netlinking

 

Archives

 
septembre 2005
octobre 2005
novembre 2005
décembre 2005
janvier 2006
février 2006
mars 2006
avril 2006
mai 2006
juin 2006
juillet 2006
août 2006
septembre 2006
octobre 2006
novembre 2006
décembre 2006
janvier 2007
février 2007
mars 2007
avril 2007
mai 2007
juin 2007
juillet 2007
août 2007
septembre 2007
octobre 2007
novembre 2007
décembre 2007
janvier 2008
février 2008
mars 2008
avril 2008
mai 2008
juin 2008
juillet 2008
août 2008
septembre 2008
octobre 2008
novembre 2008
décembre 2008
janvier 2009
février 2009
mars 2009
avril 2009
mai 2009
juin 2009
juillet 2009
août 2009
septembre 2009
octobre 2009
novembre 2009
décembre 2009
janvier 2010
février 2010
mars 2010
avril 2010
mai 2010
juin 2010
juillet 2010
août 2010
septembre 2010
octobre 2010
novembre 2010
décembre 2010
janvier 2011
février 2011
mars 2011
avril 2011
mai 2011
juin 2011
juillet 2011
août 2011
septembre 2011
octobre 2011
novembre 2011
décembre 2011
janvier 2012
février 2012

Lettres d'actualité

 
Actu Moteurs : revue de presse hebdomadaire
Recherche & Référencement : lettre professionnelle mensuelle

L'actu des moteurs

 


Liens

 
Abondance.com
Réseau Abondance
Un site du Réseau Abondance (english version : Search Engine Tools) :
Information : Abondance - Forums Abondance - Boutique Abondance - Livre Référencement - Livre Google
Outils : Outiref - Visiref - Keyword Search Engine - Spider Simulator - Soumission-Manuelle - Flash Moteurs - Moklic
Divers / Jeux : Googlefight - Klevener - Googland - Grifil.com
Moteurs de recherche : Mozbot.fr - Motref - Grifil.net - Biomalin - Foot Engine - SearchWings