Le duplicate content, qu’est-ce que c’est ?

Glossaire Web

Vous avez probablement entendu dire que le « Duplicate Content », ou contenu dupliqué, est mauvais pour le référencement de votre site internet. Mais qu’est-ce que cela signifie réellement ? Et comment savoir si vous avez du contenu dupliqué sur votre site Web ? Et si c’est le cas, que faut-il faire pour y remédier ? Une Rédac vous répond à ces questions et à bien d’autres concernant le duplicate content.

Duplicate content, traduit par contenu dupliqué en français, désigne le fait qu’un contenu identique se retrouve sur une ou plusieurs pages internet au sein d’un même site, ou bien sur plusieurs autres sites web qui traitent du même sujet, les mêmes domaines d’expertise. Ce contenu dupliqué peut être une page complète comme un tout petit fragment d’article, un petit bout de phrase.


Le contenu dupliqué est un problème qui survient lorsque le même contenu apparaît sur plusieurs pages. Cela peut se produire pour diverses raisons, notamment :

  • Le même texte,
  • Des images,
  • Des vidéos apparaissant sur plusieurs pages

sources : Définitions Marketing

Attention

Ce genre de contenu peut être le fruit de manipulations beaucoup plus courantes et dû à des situations dites naturelles : sources à mettre en lumière, prises et récoltes d’informations, mise en page de citations, reprises d’extraits de documents ou fiches techniques précises, etc.)
Même si le créateur de contenu prend le temps de relire et de formuler autrement chacune de ses phrases issues de duplicate content, les algorithmes de Google parviennent, tout de même, à le desceller, et surtout à calculer le taux de similarité des textes utilisés.

Vue aérienne de bâtiments très similaires, comme copiés-collés.

Comment Google traite-t-il le contenu dupliqué ?

Le problème est que les moteurs de recherche comme Google ne savent pas quelle version doit avoir plus d’importance et être mieux classée dans leurs résultats de recherche. Le contenu dupliqué crée une confusion pour les utilisateurs ainsi que pour les moteurs de recherche. Lorsqu’il est détecté, il y a tout un processus de tri et de filtre. Les algorithmes de Google filtrent les données et les résultats afin de mettre en avant le contenu qu’ils considèrent comme l’originel, le premier publié. Ou alors, ils choisiront de mettre en avant celui qu’ils considèrent comme le plus digne de confiance pour l’internaute.

Il est cependant rare que Google pénalise ou punisse un site comportant des contenus dupliqués. Seuls les sites internet dont l’entièreté des contenus est le résultat de copier-coller sauvage d’un même site web sont pénalisés.

Comment puis-je trouver du contenu dupliqué sur mon site ?

Google Search Console

La première chose que vous pouvez faire est d’utiliser la Google Search Console (anciennement Webmaster Tools). Elle dispose d’une fonctionnalité qui vous permettra de voir quelles sont les pages de votre site qui ont un contenu dupliqué.

Status Checker Bing

La deuxième option consiste à utiliser l’Index Status Checker de Bing pour vous assurer que chaque page de votre site est unique et n’est pas indexée deux fois par Bing. Cet outil vous permet également de vérifier les liens brisés et les erreurs liées aux fichiers robots.txt, entre autres.

Duplicate COntent Detector Moz

Une troisième méthode consiste à utiliser l’outil Duplicate Content Detector de Moz, ou le Duplicate Content Checker d’Ahrefs. Il s’agit de deux outils gratuits qui permettent aux utilisateurs de trouver facilement les doublons sur leurs sites ou domaines.

Grâce à ces différentes méthodes mises en place, vous êtes capables de détecter si votre contenu a été dupliqué ou non. Vous pouvez donc agir en conséquence et éviter cette situation délicate.

Que dois-je faire après avoir trouvé du contenu dupliqué ?

Supprimez le duplicate content

L’étape suivante consiste à supprimer le contenu dupliqué de votre site. Vous pouvez le faire de deux façons : en utilisant la fonction de recherche et de remplacement ou en utilisant un plugin comme SEO Smart Links ou SEO Smart Video (pour WordPress).

Mais alors, comment peut-on éviter le duplicate content ?

Gros plan d'une main de femme qui est sur son ordinateur, tenant sa souris, cherchant des solutions contre le duplicate content.

Tout contenu dupliqué peut devenir embêtant pour le référencement de votre site. Votre positionnement sur les pages de résultats des moteurs de recherche sera également impacté. Afin d’éviter un maximum ce genre de restriction, il faut se dérober de produire ce genre de contenu.

Les bonnes pratiques pour éviter tout contenu dupliqué

Pour éviter le contenu dupliqué, vous devez vous assurer que votre site contient des éléments similaires suivants :

  • Redirections 301 : les redirections sont utilisées pour indiquer où une page a été déplacée
  • Balises canoniques : un élément de métadonnées qui indique aux moteurs de recherche la version ou l’édition préférée
  • Balise Rel=canonical : un élément de lien que vous pouvez utiliser en HTML pour indiquer à Google quelle page est l’originale et doit être indexée par le moteur de recherche
  • Noindex : utilisé pour empêcher les moteurs de recherche d’indexer une page
  • Nofollow : utilisé pour empêcher les liens de transmettre leur autorité

Il existe également des techniques avancées qui peuvent vous aider à éviter le contenu dupliqué, notamment depuis la création de votre contenu. Pour se faire, vous devez :

  • Limiter les répétitions : dans vos articles, dans vos pages et dans tous vos contenus. Cela peut être des mots, des sujets ou encore des idées.
  • Limiter les contenus trop similaires au cœur même de votre site internet. Cela impactera également votre positionnement et votre référencement. Google jugera votre contenu comme pauvre.
  • Évitez de publier des phrases incomplètes ou vides. La publication d’une page qui ne contient pas de contenu réel est loin d’être appréciée des internautes et des robots.
  • Créez du contenu inédit et innovant ! Que cela soit par le fond ou sa forme, osez la nouveauté. Laissez-vous tenter par une autre approche que vos concurrents directs.

À retenir : Lorsque vous créez ou modifiez vos pages Web, il est important de suivre les meilleures pratiques en matière de contenu original et de qualité.

Lorsque vous créez ou mettez à jour une page web, assurez-vous que le contenu est unique et ne correspond à aucune de vos autres pages. Le duplicate content aura un impact sur votre référencement ainsi que sur l’expérience utilisateur.

Le contenu dupliqué peut être un véritable problème, mais il existe des mesures que vous pouvez prendre pour l’éviter. En suivant les conseils livrés par Une Rédac, vous vous assurer que votre site Web est optimisé pour les moteurs de recherche et les utilisateurs !

Et vous, avez-vous déjà fait face à un cas de duplicate content ? Comment avez-vous réagi ? Partagez votre expérience en commentaires !

Vous pouvez aussi lire : 8 outils SEO pour améliorer votre référencement !

Tags :
duplicate content,écrire pour le web,glossaire,Marketing content,Rédaction web,Référencement,Seo

Partager :

close up d'éléments architecturaux qui se repète pour illustrer le propos de contenu dupliqué

Besoin d'une rédaction ?

Nous écrivons, c’est notre métier. Pour le SEO, le web, la presse et tellement d’autres domaines.