Contenu dupliqué

Définition

Le contenu dupliqué (“duplicate content” en anglais) est un contenu en double sur internet. Il s’agit d’un contenu majoritairement identique, une sorte de copié/collé, qui est présent plusieurs fois sur le web, sur des URLs distinctes.

On distingue deux types de contenu dupliqué :

Contenu dupliqué en interne

Sur un même site web, la duplication de contenu n’est pas recommandée au risque de se voir pénaliser par les moteurs de recherche et impacter sa notoriété. Elle peut survenir lors d’un problème de configuration du site, d’indexations de pages ou autre. Les site de E-commerce sont les plus à risque de faire du contenu dupliqué avec les fiches produits. Les erreurs les plus courantes sont :

  • indexation d’un site avec ou sans www, en http et https
  • avoir créé une nouvelle page sans avoir redirigé l’ancienne (301)
  • avoir des Urls dupliquées
  • posséder plusieurs noms de domaines indexés pour un site

Contenu dupliqué en externe

Le doublon de contenu sur divers sites est pris en compte par les robots Google qui afficheront uniquement le contenu pertinent. Copier un contenu issu d’un autre site peut également vous porter préjudice dans d’autres domaines. Dans le cas d’un contenu dupliqué sur un autre site, l’impact SEO est d’autant plus important. Il peut être de nature accidentelle avec la rédaction de fiches produits similaires, en provenance d’un même fournisseur ou bien être réalisé volontairement.

Quels sont les dangers d’un contenu dupliqué ?

Un contenu dupliqué est à la fois pénalisant aux yeux de l’utilisateur et aux yeux de Google. L’expérience utilisateur est affaiblie en raison d’une information identique sur plusieurs résultats de recherche. Du point de vue de Google, la duplication de contenu a un impact négatif sur le référencement d’un site web et sur son trafic.

Google a mis au point un algorithme lui permettant d’identifier ces contenus dupliqués, et parfois volés : Google Panda. Les pages de votre site sont crawlés afin de vérifier la qualité de contenu et son authenticité. Si un nombre trop important de contenu est dupliqué sur votre site, il se verra pénalisé par Google : baisse de notoriété, perte de positionnement etc.

De plus, si votre site possède 2 pages dont le contenu est identique, ces dernières peuvent entrer en concurrence pour se positionner. L’une des deux pages risque de ne pas se positionner et donc de ne pas impacter positivement votre référencement. Proposer deux pages au contenu dupliqué utilise également votre crawl budget et Google perdra du temps à crawler des pages identiques au lieu de parcourir votre site sur des contenus stratégiques.

Des solutions pour éviter le contenu dupliqué ?

Balises canonical : canonicalisation des Urls

Pour ne pas créer de contenu dupliqué sur un site, vous pouvez utiliser la balise canonical qui permet d’indiquer la page de référence d’un contenu. Elle permet de désigner une page référente sur votre site, et d’indiquer à Google de crawler cette page au lieu de l’autre dont le contenu est dupliqué. Elle doit être placée dans la partie head de la page de référence et des pages au contenu similaire.

Non-indexation de certains contenus

Si le contenu dupliqué se présente sur des pages jugées non qualitatives ou non stratégiques, vous avez la possibilité de ne pas les indexer. Toutefois cette méthode n’est pas conseillée si vous souhaitez avoir un site qualitatif sur l’ensemble de vos pages. Il vous suffit de placer la balise “noindex” sur vos pages afin d’indiquer à Google de ne pas les indexer, mais tout de même les crawler. Elle se présente comme suit : < meta name = « robot » content = « Noindex, Follow » >

Contenu dupliqué : comment l’identifier sur son site ?

Le contenu dupliqué peut facilement être détecté sur un petit site sans avoir recours à des outils techniques SEO. Mais lorsque votre site possède de nombreuses pages, il est plus compliqué d’identifier ces contenus. Pour vous faciliter la tâche, Screaming Frog est un outils SEO qui vous permet de crawler votre site web tout comme le ferait Google. Grâce à une analyse de données technique, vous serez en mesure d’identifier les contenus dupliqués à revoir. Une autre possibilité d’identifier un contenu dupliqué est tout simplement de le coller dans la barre de recherche Google. Si votre contenu est dupliqué, vous pourrez l’observer dans les résultats similaires obtenus.

Dans votre stratégie SEO, il est important de régulièrement vérifier votre site afin de vous assurer de la qualité du contenu et de l’absence de contenu dupliqué. Pour se faire, vous pouvez utiliser des outils essentiels en SEO : Google Search Console et Screaming Frog.