Le Duplicate content
Le duplicate content peut être un véritable problème en référencement pour bien indexer des pages. Le moteur de recherche Google essaie de lutter contrer la copie de texte et il convient de bien comprendre pourquoi le contenu dupliqué est susceptible d’être pénalisant pour un site. C’est la raison pour laquelle cet article explique toutes les bases à connaitre sur ce sujet.
Il faut quand même faire un distinguo entre le Duplicate Content non malvaillant et le duplicate content malvaillant. Google fait bien la différence entre les deux.
Le Duplicate Content non malvaillant : À l’origine, la plupart de ces contenus ne sont pas malveillants.
Exemples de contenu non malveillant :
• forums de discussion pouvant générer à la fois des pages normales et des pages « raccourcies » destinées aux mobiles ;
• articles en vente affichés ou liés via plusieurs URL distinctes ;
• versions imprimables uniquement de pages Web.
Si votre site contient plusieurs pages dont le contenu est très similaire, vous pouvez indiquer à Google votre URL préférée de plusieurs façons. (C’est ce qu’on appelle la « canonicalisation ».)
Le Duplicate Content malvaillant : Le contenu est délibérément dupliqué entre les domaines afin de manipuler le classement du site par les moteurs de recherche ou d’augmenter le trafic. Ce type de pratique trompeuse peut avoir des effets négatifs sur la navigation de l’internaute qui voit quasiment le même contenu se répéter dans un ensemble de résultats de recherche.
Google s’efforce d’indexer et d’afficher des pages contenant des informations distinctes. Avec ce filtrage, si votre site propose, par exemple, une version « ordinaire » et une version « imprimable » de chaque article et qu’aucune de ces deux versions n’est bloquée par une balise Meta noindex, Google choisira l’une des deux pour l’inclure dans la liste.
Dans les rares cas où Google estime que du contenu en double est peut-être affiché dans le but de manipuler nos classements et de tromper les internautes, il apporte également les ajustements appropriés dans l’indexation et le classement des sites impliqués.
Il existe un certain nombre de mesure qui permettent résoudre les problèmes de contenus en double :
• Utilisez des redirections 301
• Etre cohérent : dans le système de liens internes.
Par exemple, n’établissez pas de lien vers http://www.exemple.com/page/, http://www.exemple.com/page ni http://www.exemple.com/page/index.htm.
• Utilisez des domaines de premier niveau
• Soyez prudent en diffusant votre contenu
• Utilisez les Outils pour les webmasters afin de nous indiquer le type d’indexation à privilégier pour votre site
• Limitez les répétitions
• Évitez la publication de pages incomplètes
• Apprenez à maîtriser votre système de gestion du contenu
• Limitez les contenus similaires
Si vous découvrez qu’un autre site duplique votre contenu en le détournant (détournement et republication), il est peu probable que cela ait des effets négatifs sur le classement de votre site dans les pages de résultats de recherche Google.
Previous Entry: Pertinence des fautes d’orthographe dans les mots clefs.
