5 outils pour détecter le contenu dupliqué sur vos pages

5 outils pour detecter le contenu duplique sur vos pages

Vous avez passé du temps à rédiger un contenu sur votre site web et vous vous rendez compte que quelqu’un l’a copié/collé mot pour mot sur une de ses pages ?

C’est énervant, non..?

Mais c’est aussi un problème pour votre SEO, car du contenu en double peut impacter votre visibilité dans les pages de résultats de recherche.

Et si on voyait ensemble les outils pour détecter et lutter contre le contenu dupliqué ?

C’est justement le sujet de cet article 😉 

Qu’est-ce que le contenu dupliqué ?

Le contenu dupliqué est le fait de copier, que ce soit partiellement ou intégralement, un contenu déjà existant sur une page web. En anglais, on l’appelle “duplicate content”.

Prohibée par Google, cette pratique peut être volontaire ou involontaire. 

Certaines personnes copient/collent un contenu et vont l’utiliser pour ajouter du contenu sur leur site pour gagner du temps. C’est tout simplement du plagiat

Cependant, le fait de produire du contenu dupliqué est parfois involontaire. Ça peut arriver à n’importe qui de rédiger un contenu similaire à un autre sans le savoir. C’est souvent le cas pour des fiches produits d’articles similaires, par exemple.

Il faut savoir qu’il existe également 2 types de contenu dupliqué.

Duplicate content interne 

On parle de contenu dupliqué interne lorsque Google détecte des contenus identiques sur un seul et même site.

Ce n’est pas la forme de duplicate content la plus grave, mais qu’elle soit volontaire ou non, elle peut avoir un impact sur le référencement naturel du site web.

Contenu dupliqué externe

Le contenu dupliqué externe concerne 2 pages web avec 2 URLs différentes.

Pourquoi vouloir éviter le contenu dupliqué ?

Le duplicate content est ce qu’on appelle une mauvaise pratique en SEO, une technique de “triche” qui n’est pas vraiment appréciée par Google. 

En 2011, la mise à jour Google Panda a d’ailleurs été mise en place pour mieux filtrer les contenus de mauvaise qualité.

Aujourd’hui, les algorithmes sont encore plus performants et Google détecte si le contenu d’un site web est identique ou très similaire à un contenu déjà existant. 

Et même si le moteur de recherche n’applique pas de pénalité pour cette pratique, il peut très fortement réduire la visibilité des pages qui proposent du contenu dupliqué puisqu’elles n’apportent rien de plus à l’internaute. 

Parfois, il même aller jusqu’à désindexer ces pages.

Ainsi, en vérifiant le contenu dupliqué avant la publication de vos contenus, vous évitez le risque de perdre en visibilité.

Comment éviter le duplicate content ?

Créer du contenu original

Le premier conseil pour ne pas retrouver de contenu dupliqué sur votre site web est de rédiger des contenus 100% originaux.

Pas de copier-coller d’un bloc de contenu provenant d’un autre site ou d’une de vos propres pages web !

Utiliser un outil pour détecter le duplicate content

Vous venez de rédiger un contenu ?

Vérifiez la présence de contenu dupliqué avec un outil avant de le publier sur votre site, car on l’a vu, le contenu dupliqué est parfois involontaire !

Et ça tombe bien, je vous présente quelques outils pour lutter contre le contenu dupliqué juste après 😉 

Protéger son site web du contenu dupliqué

Eh non, tout le monde n’est pas toujours bienveillant sur le web…

Les voleurs de contenus ne se gênent pas pour plagier votre texte, parfois dans son intégralité ! 

Certains plugins WordPress peuvent être efficaces pour protéger vos contenus :

5 outils pour détecter le contenu dupliqué

Heureusement, il existe de nombreuses solutions pour détecter le contenu dupliqué sur une page web et réussir ainsi à s’en débarrasser.

Ces outils ont tous un fonctionnement plus ou moins similaire : 

  1. Ils analysent le contenu que vous leur soumettez en le comparant à tous les autres contenus de leur base de données.
  2. Ils mettent ensuite en lumière les éléments de contenu dupliqué repérés dans le contenu, souvent en indiquant l’URL à l’origine du contenu.
  3. Ils vous donnent un score, compris entre 0 et 100%, selon le nombre d’éléments dupliqués contenus dans votre texte. Plus le score est bas, mieux c’est !

Copyscape

detecter le contenu duplique avec copyscape

En version gratuite, Copyscape vous permet d’entrer votre URL et de détecter si votre contenu est dupliqué ailleurs sur le web.

Même si elle est très fiable, la version gratuite est assez limitée. En revanche, la version payante dispose de fonctionnalités très intéressantes comme : 

  • l’envoi de texte ou de fichier à analyser,
  • la vérification d’un site web complet (jusqu’à 10 000 pages), 
  • l’utilisation d’une API,
  • etc.

Quetext

analyser le contenu duplique avec l'outil quetext

C’est un de mes outils préférés pour détecter le contenu dupliqué avant de publier mes articles sur le blog !

En entrant l’URL d’une page web, Quetext se charge d’analyser son contenu et vous indique si le texte, ou des extraits de texte, sont présents ailleurs sur le web grâce à un score de similarité.

En version gratuite, vous êtes limités à des textes de 1 000 mots.

Dupli Checker

lutter contre le duplicate contect grace a dupli checker

Autre outil très intuitif à utiliser : Dupli Checker.

Vous pouvez analyser un contenu en :

  • copiant-collant votre texte (limité à 1 000 mots en version gratuite), 
  • téléchargeant un fichier,
  • en indiquant une URL.

Le petit + de l’outil : vous avez également accès à une fonction de correction orthographique, de réécriture, de téléchargement des rapports de duplicate content…

Kill Duplicate

lutter contre le plagiat avec kill duplicate

Kill Duplicate est un outil payant (à partir de 19€ par mois) et particulièrement efficace.

Il scanne les URLs de votre site et vous permet d’identifier les duplications externes de vos contenus.

Vous avez également la possibilité d’agir directement depuis le tableau de bord de l’outil, notamment pour contacter un hébergeur, déposer une plainte, etc.

Screaming Frog

screaming frog est un outil pour la detection de contenu duplique

Grâce à son outil de SEO Spider, le logiciel Screaming Frog scanne toutes les pages web de votre site pour ensuite analyser son contenu, que ce soit le texte de la page web ou des balises HTML. 

En version gratuite, il est possible de tester jusqu’à 500 URLs. 

Petit + bien pratique : il analyse aussi les liens cassés et les erreurs de serveur !

Que faire en cas de contenu dupliqué ?

Vous avez détecté des duplications de votre contenu sur le web ?

Aïe :/

Et surtout que faire ? Comment lutter contre le plagiat ?

C’est simple ! Suivez ces 3 étapes.

1. Contacter le propriétaire du site web

Avant de vouloir alerter le FBI, vous pouvez commencer par contacter le propriétaire du site qui duplique votre contenu (peut-être involontairement).

C’est le meilleur moyen pour régler le problème de la manière la plus douce possible.

Pour ça, vous pouvez accéder à ses coordonnées :

  • sur la page Contact,
  • dans les Mentions Légales,
  • sur ses réseaux sociaux, 
  • grâce au WHOIS, l’annuaire des noms de domaine.

2. Contacter l’hébergeur du site web

Le propriétaire du site fait la sourde oreille ? Vous n’arrivez pas à vous entendre ?

Vous pouvez passer à l’étape supérieure, à savoir : contacter l’hébergeur de son site web. Cette information se trouve dans les Mentions Légales ou sur le WHOIS.

Captures d’écran à l’appui, expliquez à l’hébergeur que son utilisateur viole le droit d’auteur en plagiant votre contenu. Les hébergeurs sont souvent sensibles à ces requêtes et devraient pouvoir vous aider rapidement.

3. Avertir Google

Si les 2 méthodes précédentes n’ont pas porté leurs fruits, il est temps de passer à l’étape supérieure : effectuer un signalement à Google.

En soumettant une demande DMCA (Digital Millennium Copyright Act) au moteur de recherche, vous pouvez lui demander de retirer des moteurs de recherche les pages contenant des duplications de votre contenu.

Voici la marche à suivre complète : 

  • rendez-vous sur cette page, et sélectionnez l’onglet “Recherche Google”, 
  • choisissez l’option “Problème de propriété intellectuelle”,
  • cochez “Atteinte aux droits d’auteur”,
  • indiquez que vous êtes le propriétaire des droits d’auteur en sélectionnant “Oui, je suis le titulaire des droits d’auteur ou je suis autorisé à agir au nom du titulaire d’un droit exclusif auquel j’estime qu’il a été porté atteinte”
  • pour le type de contenu mis en cause, choisissez “autre”,
  • cliquez sur “Créer une demande”,
  • complétez le formulaire et envoyez-le.

Avez-vous déjà eu des problèmes de contenu dupliqué sur votre site web ? Dites-moi si cet article vous a aidé à mieux comprendre cette mauvaise pratique SEO en commentaire 😉 

Partager :

Laisser un commentaire