Google estimait en 2015 que plus de 60 % des sites internet publiaient du contenu dupliqué, ou duplicate content en anglais. Pour bien comprendre les enjeux et les risques de cette pratique, plusieurs questions se posent. De quoi s’agit-il ? Quels sont ses dangers pour les sites internet ? Quel impact pour les rédacteurs web ? Pour le savoir, lisez ce qui suit.
Qu’est-ce que le contenu dupliqué ?
On parle de duplicate content lorsqu’un même contenu est accessible sur plusieurs pages internet, accessibles via des URLs différentes. Le contenu d’une page est copié partiellement ou en totalité, pour être publié à l’identique ou de façon très similaire sur une autre page web.
Le contenu dupliqué interne
Un contenu peut être dupliqué en interne, sur une ou plusieurs pages d’un même site internet. C’est le cas par exemple :
- des sites e-commerce qui proposent des produits très similaires et affichent les mêmes fiches-produits, avec seulement une petite variante (par exemple la couleur : robe d’été rouge, robe d’été noire, etc.) ;
- de certains sites internet qui ont plusieurs pages pour présenter des versions régionales de leurs produits ou services, mais avec exactement le même contenu (exemple : une page « serrurier à Nantes », une autre « serrurier à Rennes », une autre « serrurier à Caen »).
Parfois, le problème du duplicate content est dû à une mauvaise conception ou gestion du site internet :
- il arrive que les pages d’un même site aient deux versions, une version ordinaire et une imprimable, avec exactement le même contenu ;
- un même contenu peut-être accessible sur les pages du site, mais aussi sur un document PDF téléchargeable ;
- la modification de l’URL d’une page a pour effet de créer deux URLs différentes, mais qui renvoient à la même page et donc au même contenu ;
- etc.
Ces doublons peuvent facilement être corrigés en indiquant aux robots de Google (googlebots) quelle est la page à indexer, via les balises page canonique « rel=canonical » ou de redirections « 301 » ou « 201 ».
Je veux recevoir ma mini-formation GRATUITE !
Rendez-vous dans votre boîte mail
En recevant le programme de formation vous consentez à ce que FRW collecte vos données afin de vous envoyer des communications par voie électronique. Vous pourrez vous désabonner à tout moment. Pour en savoir plus, nous vous invitons à consulter notre politique de confidentialité.
Le contenu dupliqué externe
Il arrive souvent que le contenu d’une page soit copié et publié sur un autre site internet. Il peut s’agir :
- d’articles d’actualité, de l’AFP par exemple, reproduits à l’identique sur plusieurs sites d’informations (cas très fréquent) ;
- de contenus dupliqués intégralement ou partiellement par d’autres sites, à titre de référence ;
- de la copie pure et simple de contenus par un site tiers de façon malveillante, autrement dit du plagiat.
Contenu dupliqué : le risque d’un mauvais référencement naturel
Le premier danger concerne les sites internet qui risquent de perdre des places sur les pages de résultats des moteurs de recherche.
Quelle est la politique de Google vis-à-vis du duplicate content ?
Il n’y a pas de réelle pénalité pour les sites qui pratiquent la duplication de contenus. Ce n’est d’ailleurs pas l’objectif car avec plus de 60 % de sites concernés, ce serait contreproductif. Mais les pages dupliquées se retrouvent sur l’index secondaire, qui n’apparaît même pas dans la SERP, sauf si l’internaute relance la recherche en incluant les pages ignorées.
Depuis 2011 et la mise à jour Panda, Google utilise un filtre qui permet d’éviter le référencement de doublons sur ses pages de résultats. L’objectif est de ne pas proposer plusieurs fois le même contenu à l’internaute. Imaginez si en tapant une requête, vous tombiez trois ou quatre fois sur le même contenu publié par des sites différents. Vous ne seriez pas satisfait et changeriez de moteur de recherche. C’est ce que Google veut éviter.
En revanche, si l’objectif du duplicate content est de tromper et de manipuler les résultats des moteurs de recherche, Google peut aller jusqu’à pénaliser le site internet fautif. Il s’agit en effet d’une pratique SEO abusive dite « black hat».
Il existe aussi une procédure pour signaler à Google le vol des contenus portant atteinte aux droits d’auteur (plagiat).
Comment fonctionne le filtre de Google ?
Lorsque l’algorithme de Google repère du contenu dupliqué, il essaye de déterminer quelle est la page canonique, c’est-à-dire celle qui, selon lui, l’a publié en premier. Pour cela, il examine plusieurs critères, notamment :
- la date de la première découverte du contenu : sur quel site il a été identifié (crawlé) pour la première fois par ses robots ;
- la puissance des différents sites qui ont publié ce même contenu : celui qui fait autorité, qui est déjà bien positionné, qui a publié beaucoup de contenus, est considéré comme ayant plus de chances d’en être à l’origine.
Une fois cette petite enquête menée, Google affiche uniquement la page canonique dans les premiers résultats de la SERP. Les autres pages ne sont pas désindexées, mais elles n’apparaissent pas automatiquement.
En théorie, ce principe de filtre semble logique et juste. Mais en pratique, ce n’est pas aussi simple que ça.
Quand plusieurs pages ont publié le même contenu, l’algorithme de Google ne parvient pas toujours à déterminer quelle est celle qui en est à l’origine. Les pages sont en concurrence les unes avec les autres. Dans ce cas, cela handicape le référencement de toutes les pages, celle à l’origine du contenu, tout comme celles qui l’ont dupliqué.
Il peut également arriver que la page canonicale, celle qui a publié le contenu en premier, ait une autorité de domaine plus faible que celle qui l’a copié (site internet récent, avec peu de contenu par exemple). Google peut alors se tromper et favoriser la page « copieuse », au détriment de celle qui est pourtant à l’origine du texte. Le site est alors injustement handicapé dans son référencement naturel.
Autant de bonnes raisons d’éviter de dupliquer du contenu…
Duplicate content : une pratique contreproductive pour le rédacteur web
Le deuxième danger du contenu dupliqué vous concerne vous, rédacteur web. Vous risquez de perdre les lecteurs et par la force des choses, vos clients. Votre mission est de créer du contenu rédactionnel de qualité et original. Il doit être attractif, intéressant et apporter de la valeur. Si vous vous contentez de copier-coller, ou de reformuler grossièrement ce qui a déjà été publié sur le web, les internautes ne seront pas satisfaits. Quel est l’intérêt de relire une énième fois ce qui a déjà été publié et republié ailleurs ? Un lecteur qui apprécie le contenu proposé reste sur la page. À l’inverse, un lecteur insatisfait la quitte.
Cela entraîne à coup sûr une expérience utilisateur (UX) négative. L’internaute ne restera pas sur la page web. S’ensuit alors une spirale inéluctable : augmentation du taux de rebond, baisse du trafic sur le site, référencement naturel pénalisé, diminution du taux de conversion et donc chute du chiffre d’affaires. Bref, à éviter à tout prix !
Ceci est d’autant plus vrai que les clients ne sont pas dupes et ont à leur disposition toute une batterie d’outils pour détecter le contenu dupliqué. Vous ne passerez pas entre les mailles du filet et perdrez votre client. C’est votre réputation de rédacteur web qui est en jeu.
Vous devez donc faire de votre mieux pour créer des textes originaux qui soient à la fois instructifs, engageants et qui répondent aux attentes de vos clients. Si ces derniers sont contents de votre travail, une relation productive sur le long terme est assurée.
Rédacteurs web : transformez les dangers du plagiat en atouts !
Vous l’aurez compris, le duplicate content est à proscrire. Il peut être préjudiciable pour votre image de rédacteur web, mais aussi pour votre client. Et si vous utilisiez cet argument pour convaincre vos prospects de vous confier des missions ?
Vous pouvez alerter votre potentiel client sur les dangers du contenu dupliqué interne et lui proposer :
- de rédiger des fiches-produits uniques et originales ;
- de créer du contenu exclusif et de qualité pour les différentes pages de ses produits ou services régionalisés ;
- un audit SEO de son site pour identifier les pages dupliquées et suggérer des correctifs (balises pages canoniques ou balises de redirection).
Lorsque vous identifiez des sites ou blogs qui se contentent de copier des contenus déjà existants sur la toile, proposez-leur vos services pour la rédaction d’articles et de pages originaux. Si vous leur expliquez en quoi le duplicate content risque de pénaliser leur référencement naturel, vous attirerez plus facilement leur attention.
Si votre client constate que d’autres publient du contenu copié sur son propre site, suggérez-lui de vérifier que ces publications dupliquées intègrent bien un lien avec une balise canonique vers son site. En cas de plagiat, informez-le de la possibilité d’en référer à Google pour y remédier. Vous apporterez une solution concrète à son problème et cela le mettra dans de bonnes dispositions pour vous confier des missions de rédaction.
Que ce soit pour le référencement naturel ou l’expérience utilisateur, le contenu dupliqué représente des risques que l’on peut éviter. Conseillez vos clients, informez-les des dangers du duplicate content, proposez une stratégie éditoriale pertinente et rédigez des textes uniques.
???? Pour maîtriser les aspects du contenu dupliqué et apprendre à rédiger des textes originaux qui apportent de la valeur aux lecteurs, pensez à la formation en rédaction web ! ????
Inga Penverne – Rédactrice SEO et ancienne élève Liberté