Le duplicate content est un souci qui se pose lorsque l’on possède un site web, c’est le résultat d’un contenu identique présent sur plusieurs pages, qu’elles soient sur votre propre site (duplicate interne) ou sur un site tiers (duplicate externe).
Partagez cet article
Comme vous le savez surement, le contenu dupliqué, qu’il soit interne ou externe, peut avoir un mauvais impact sur votre site. En effet, Google pourrait ne pas indexer les pages qui sont en contenu dupliqué. Sans parler de pénalité, la qualité globale de votre site risque de chuter aux yeux de Google et celui-ci risque de plus difficilement explorer et, in fine, indexer vos pages. En les temps actuels, avec les problèmes d’indexation connus de tous, on aurait tout intérêt à surveiller le duplicate content.
Oui, mais comment faire ? Dans cet article, nous allons vous présenter plusieurs outils qui vous aideront à détecter le contenu dupliqué, qu’il soit interne ou externe.
Les outils contre le contenu dupliqué interne
Screaming Frog
Le célèbre crawler permet de détecter le contenu dupliqué interne à un site. Par défaut, il détecte le contenu dupliqué exact. Mais en entrant dans les paramètres de l’outil, nous pouvons déceler les contenus proches sans être similaire. Pour régler cela, il suffit d’aller dans configuration, puis dans contenu et enfin doublon. Là, vous pourrez choisir le seuil de similarité. Si besoin dans contenu ⇒ domaine, vous pouvez exclure des parties de votre site en les sélectionnant par balise, classe ou ID.
Siteliner
À l’instar de Screaming Frog, Siteliner permet de détecter le duplicate content interne. Vous pouvez entrer l’URL de votre propre site, puis il vous sortira un rapport avec le contenu dupliqué par page, avec les pourcentages de correspondance, le nombre de mots correspondants ainsi que la puissance de la page. En cliquant sur l’url, vous pourrez voir apparaitre votre page avec les textes dupliqué surligné en couleurs, avec une couleur par url, ce qui est très parlant. Siteliner propose une analyse de 250 pages gratuite par mois et par site, au-delà vous devrez débourser 1 centime par page analysée.
Les outils contre le duplicate content externe
Kill Duplicate
Kill Duplicate est un outil français créé par Paul Sanchez, consultant SEO depuis plus de 15 ans et président de l’agence Seohackers.
Kill Duplicate permet de vérifier le pourcentage de duplicate externe, pour chaque page, il nous indique le statut http de la page, la moyenne de duplicate content, le taux de duplication maximum et la position la plus élevée de notre page dans la SERP.
Pour chaque page, on peut voir la liste des url, avec le pourcentage de duplicate pour chaque url. On y voit aussi un bouton “solution” qui, lorsque l’on clique dessus, nous propose plusieurs options (contact site, contact hébergeur, dépôt de plainte ou duplicate résolu) afin de résoudre le problème de duplication de contenu. Vous pouvez controler votre contenu dupliqué via l’API ou directement via le site. Ce logiciel permet aussi la détection du contenu dupliqué de votre site en temps réel.
Kill Duplicate est un outil payant qui bénéficie de plusieurs formules d’abonnement allant de 19 euros à 399 euros HT selon votre besoin en nombre d’url.
Duplichecker
Duplichecker vous permet de détecter le duplicate content externe. Vous pouvez l’utiliser gratuitement jusqu’à 1000 mots, ce qui peut être un super avantage pour les étudiants, lycéen ou petits budgets. Vous pouvez également vérifier vos documents doc, PDF, TXT, etc ou votre URL. Duplichecker propose des formules d’abonnement allant de 10 $ à 200 $ par mois selon vos besoins.
PlagiarismDetector
Comme son homologue, PlagiarismDetector nous permet de tester le contenu dupliqué jusqu’à 1000 mots gratuitement, mais je le trouve un peu plus précis que son voisin du dessus. Vous pouvez placer votre texte ou directement votre url et aussi ajouter des url d’exclusion afin qu’il ne détecte pas votre propre contenu comme contenu dupliqué. PlagiarismDetector propose de forfaits allant de 20 à 90 $.
Copyscape
Copyscape est un outil puissant qui permet de détecter le plagiat à partir d’une URL. Vous pouvez l’utiliser en version gratuite, celui-ci vous ressortira alors les 10 résultats les plus probants, en cliquant sur chaque résultat, il vous affichera la page dupliquant votre contenu avec les zones communes surlignées avec un résumé dans un bandeau indiquant le nombre de mots et le pourcentage de duplication. En version premium, vous pourrez également vérifier des documents PDF ou Word ou encore bénéficier d’un plugin WordPress ou de leur API. Au niveau du pricing, il vous en coutera 3 centimes par recherche de 200 mots plus 1 centime par 100 mots supplémentaires.
Copyleaks
Copyleaks permet, grâce à l’intelligence artificielle, de détecter le plagiat et le contenu paraphrasé. Vous pouvez y insérer une URL, du texte libre, ou encore du code HTML. Dans sa version gratuite, vous disposerez de 20 requêtes par mois, cependant la plupart des résultats seront masqués. En version pro, copyleaks vous permettra d’insérer votre site et de détecter la duplication de votre contenu en temps réel. Au niveau du prix, Copyleaks propose des offres allant de 8 à 480 $ par mois.
Quetext
Avec Quetext, vous pourrez bénéficier de la technologie DeepSearch, qui permet aux algorithmes de procéder à une analyse contextuelle, en tenant compte du contexte environnant et de la vraisemblance statistique de chaque mot et expression. Quetext permet aussi de détecter la correspondance “floue” dans le cas où plusieurs mots ont été modifiés dans le but de dissimuler le plagiat. Comme la plupart de ses concurrents, Quetext dispose d’une version gratuite qui nous permet de vérifier 2500 mots par mois. En version payante, Quetext propose des offres allant de 9.99 à 49.99 $ par mois.
Conclusion
Dans cet article, nous vous avons présenté les détecteurs de plagiat les plus célèbres, évidement la liste n’est pas exhaustive et il en existe une multitude d’autres. Si vous en utiliser un en particulier, n’hésitez pas à nous l’indiquer en commentaire en expliquant pourquoi votre choix s’est porté sur celui-ci et pas un autre.
Comment Web Hors Piste peut m’aider
L’équipe Web Hors Piste vous accompagne pour définir et optimiser la stratégie digitale de votre entreprise.
Si vous avez des questions, n’hésitez pas à nous contacter et demander l’avis d’un expert.
Partagez cet article
Nos Derniers Articles
Découvrez dans notre blog SEO les dernières actualités de Référencement Naturel, les mises à jour de l’algorithme Google et des bonnes pratiques pour l’optimisation SEO de votre site.
Top 10 des meilleurs outils de SEO
En 2020, 93% des expériences digitales ont débuté sur un moteur de recherche. Découvrez les meilleurs outils SEO pour booster votre visibilité sur les moteurs de recherche.
Comment fonctionne un moteur de recherche ?
Comment Google sait quels résultats vous proposer dans les résultats de recherche ? Le processus commence avant même que vous ayez saisi votre requête…
Analyse sémantique en SEO : les meilleurs outils
Pour nous autre, humain, comprendre le sens d’un texte est quelque chose de plutôt facile, nous reconnaissons les mots selon le contexte utilisé. Cependant, pour les machines, la chose est bien moins évidente.
Nous partageons avec nos clients les dernières nouveautés dans le digital. Si cela vous intéresse, profitez-en