Vous êtes ici : Accueil » Référencement / SEO » Duplicate Content – Comment lutter contre le contenu dupliqué ?

Duplicate Content – Comment lutter contre le contenu dupliqué ?

18 juillet 2011 Référencement / SEO 19 Commentaires 3 937 vues

duplicate contentAvec l’arrivée de la mise à jour de l’algorithme de Google appelée Panda, il est devenu primordiale d’éviter tout contenu dupliqué sur son site. Que ce soit en interne comme en externe.

Je pense tout particulièrement aux propriétaires de site de publication d’article, d’annuaires et autres digg like en tout genre.

La lutte est véritablement tournée vers l’éradication du contenu dupliqué sur son site. Certains commencent déjà à en payer les frais…

Avant de commencer, je vous invite à lire cet article de Hervé d’Infinisearch dont le sujet est porté sur notre cher Google (rédigé d’un français impeccable), je pense et j’espère qu’il vous ouvrira les yeux (ou pas)…

Quoi de plus rageant que de s’apercevoir que son contenu est repris dans son intégralité par un autre site internet peu scrupuleux ? Quoi de plus énervant que de recevoir des descriptions d’articles ou de sites dupliquées à 100% ? Google en a ras le bol et on peut tout à fait le comprendre… Car on est en droit de se demander quelle est la valeur ajoutée d’une telle action ? AUCUNE !

Quelques outils pour contrôler le duplicate content

Je vais vous présenter quelques outils indispensables pour contrôler le contenu dupliqué dans un texte ou via une adresse. Le seul outil valable actuellement pour vérifier le duplicate content d’un texte est de le passer dans une moulinette qui va checker sur Google phrase par phrase est renvoyer en retour un pourcentage (plus ou moins fiable) permettant de se faire une bonne idée.

Il existait 2 outils permettant de réaliser cette action : Positeo et Infinisearch. Pourquoi j’écris au passé ? Le premier est toujours d’actualité, quant au second il a malheureusement été stoppé net, la faute à qui ? Google bien sur !!

L’outil d’infinisearch permettait d’envoyer des requêtes sur Google pour vérifier le contenu dupliqué, malheureusement l’accès à l’API de Google est limité à un nombre de requêtes par jour… Google lutte contre le duplicate content mais ne permet pas à ses utilisateurs de lutter à leur tour !! WTF ??

J’ai découvert il y a quelques semaines un autre outil mais qui ne me donne pas entière satisfaction, si quelqu’un à une vision plus approfondie que la mienne, qu’il n’hésite pas à laisser un commentaire. Il s’agit de Plagium DC.

La lutte contre le contenu dupliqué, perdue d’avance ?

La lutte contre le duplicate content n’est pas évidente et surtout elle est inégale ! Comment lutter contre un site qui reprend notre contenu à 100% sans prendre la peine de citer la source ? Comment lutter contre une personne qui après avoir soumis un article de presse dans notre site, va voir dans d’autres sites pour faire la même chose ?

Mais il y a pire dans cette lutte sans fin :

Imaginez qu’un site PR5 recopie le contenu de votre site PR2…

Imaginez que seulement quelques secondes après avoir publié votre article (sans avoir eu le temps d’être indexé par Google) il soit repris et publié ailleurs…

Dans les cas cités ci-dessous, nous sommes en droit de nous poser la question : qui sera considéré comme copieur ?? Le pire est qu’il y a de grandes (mal)chances que ce soit VOUS !!!

Web Me I’m Famous dupliqué à son tour !

Web Me I’m Famous n’est pas épargné par ce fléau, la plupart des articles que j’écris sur ce blog sont repris, parfois même à 100% sur des plateformes externes. Ils n’ont même pas le courage de changer le titre de l’article ! Mon article sur Google Panda est le plus touché… La copie n’est-elle pas la rançon du succès ?

De temps en temps ces mêmes personnes placent un lien retour en citant mon article, faute avouée, à demi pardonnée… Mais est-ce suffisant pour éradiquer le contenu dupliqué aux yeux de Google ? Pas si sûr…


Vous avez aimé ? Partagez !


Actuellement, il y a 19 commentaires sur cet article :
  1. L.Jee dit :

    Malheureusement, que la copie soit sourcée ou non ne change actuellement rien aux yeux de Google et même si celui-ci l’a très bien identifié…

    C’est d’ailleurs à ce demandé ce que fait Google, car quand on voit des copies passer devant des originaux alors que ces copies ne prennent qu’un dixième de l’article et sont des agrégateurs. Google sait ce que sont ces sites, il sait pertinemment que ceux-ci ne produisent pas de contenu et pourtant, c’est l’article plagié qui dégage des SERP.

    Enfin bon Matt Cutts l’avait dit et redit, le contenu dupliqué ce n’est rien et on ne risque rien avec lui.

    Google, ne change pas, on te déteste ainsi ;)

  2. Hervé from annuaire gratuit dit :

    Bon article qui résume ce que je pense : la lutte contre le DC sera longue et incertaine.

    Je suis en train de mener une campagne de désindexation sur Infinisearch et je suis surpris de voir bon nombre d’annuaires (présent dans le top 30 d’Atypicom) valider des description identiques de celles présentes sur Infinisearch.

    Cela peut arriver, mais certaines sont effectuées plusieurs jours après alors que mes fiches sont indexées dans 95% dans les 2/3 minutes. Soit l’annuaire ne contrôle pas le DC, soit il s’en branle.

    Et ça commence à me gaver !!

    On verra ce qu’il se passera lorsque Panda arrivera.

    Merci d’avoir cité mon article. Quant à l’outil de DC, il a fait son temps. Quoi qu’il en soit, j’en ai codé un nouveau mais il ne sera pas mis en ligne pour ne pas être de nouveau bloqué.

    Ce que je peux dire, c’est qu’il est d’une efficacité redoutable.

  3. sandrine from ski dit :

    On contrôle et on se fait peur …

    Des descriptions identiques, des communiqués entiers copiés/collés… et oui parce qu’il y a quelques années cela n’était pas nécessaire de faire des descriptions différentes à chaque fois… le duplicate content n’était pas un problème

    Alors aujourd’hui on nettoie comment tout ce contenu ?
    parce que sur des sites qui ont plusieurs années et dont le référencement a été fait pendant tout ce temps… c’est pas beau à voir il

    Faut-il défaire tout ce qui a été fait ? dans ce cas qu’en est il du coût du référencement ?

  4. Vince from Blog SEO dit :

    Pour payetonlien, mon site de CP, j’essaie de faire le max pour que les articles publiés aient moins de 50% de DC. Le problème c’est que s’ils respectent cette règle au moment de la validation, il est bien possible que ce ne soit plus le cas quelques jours plus tard, après la diffusion sur plusieurs sites de CP. Et là qui est considéré comme « l’originel » ? C’est à Gg de le décider, bien sûr :(

  5. Anthony from SitinWeb dit :

    Merci pour cet article rappelant que le Duplicat Content est dangereux pour la santé d’un site internet

    Mais suite à cette lecture, une question me vient, comment faire pour éradiquer, l’article, le site ayant fait une copie conforme ?
    Vous prenez l’exemple du Blog de Web Me I’m Famous dupliqué à plusieurs reprise, il est donc pénalisé par google juste parce que vous êtes victime d’un succès ?

    Pas très rassurant ce que dit L JEE aussi ! Même avec un lien vers l’article source Goo … ne fait pas la différence, ignore ….

    Je n’ai pas encore aussi grande notoriété pour est victime de DC mais je me dis que tant mieux !

    Anthony

  6. Max from Annuaire Batiment dit :

    Comme tu le dis si bien, c’est un combat inégal…

    Personnellement, c’est la raison pour laquelle j’ai décidé de faire un annuaire thématique et de limiter volontairement mon champ d’action, cela me permet de vérifier de temps en temps les fiches des webmasters et lorsque je trouve un DC beh c’est : url redirigé, suppression de fiche et envoi d’un mail salé…

    D’ailleurs, j’ai remarqué que certaines « agences de référencement » étaient des pros du DC : une honte !

    Dans le cas ou c’est toi qui est l’auteur des écrits, mise à part entamer une procédure pour montrer l’exemple et de gagner (ce qui n’est pas fait loin de la) et beh, tu l’as dans le baba….

    La est toute l’injustice : tenter de faire du propre sans en avoir réellement les moyens…

    Je retweet ;)

  7. Antoine from outil référencement dit :

    Pour répondre à ta question sur les softs, je te conseille UN.CO.VER. Tu peux ckecker une portion de contenu ou un domaine entier. Et il te donne les proportions de dupliquées avec les fragments de mots qu’il trouve. Super pratique :)

  8. L.Jee dit :

    Dans le cas ou c’est toi qui est l’auteur des écrits, mise à part entamer une procédure pour montrer l’exemple et de gagner (ce qui n’est pas fait loin de la) et beh, tu l’as dans le baba….

    Et encore ce n’est pas gagné, il faut que tu puisses prouver que tu en es l’auteur et là, tu peux te toucher. J’ai testé de déposer plainte etc. mais sans aucune protection tu te retrouves dans une impasse la plupart du temps.

    • Max from Annuaire Batiment dit :

      Effectivement, rien est gagner et entamer une procédure demande du temps…

      Autant dire que c’est compliqué…

      Euh L. Jee, vous reprenez mes dires sans les citer ^^

  9. Tom from bonus dit :

    Il y a une solution pour protéger son contenu et ses droits d’auteur, c’est copyscape

  10. L.Jee dit :

    Comment ça je reprends sans citer ? Effectivement je n’avais pas mis en forme mais c’était dans le but de citer, honte à moi, je fais du DC LOL

  11. Jay from Gourde dit :

    En effet, je ne vois pas de solution anti copie… certains l’utilisent a faire du negative seo! arfff…
    devra t on payer des sociétés spécialisés pour faire disparaitre le duplicate content de ses pages?!

  12. Nicolas from iPhone 5 dit :

    Un problème qui n’a pas non plus été évoqué est celui du vol de contenu à l’intérieur des sites de CP ou annuaires par exemple…

    Des personnes peu scrupuleuses s’amuse à scrapper les fiches concourrentes plus ou moins consciemment pour faire du Nseo et duplique sur un autre annuire…ça m’ennerve particulièrement…

  13. Antoine from formation emarketing dit :

    On croirait être à l’aube d’une nouvelle ère, avec un nouveau métier : chasseur de negative SEO…!

    Le problème du contenu dupliqué est omniprésent et on a pas réellement de recours… Wait and see, Google bouge beaucoup en ce moment, et prévoit peut être une solution.

  14. Luc from Création de sites internet dit :

    Merci pour cet article, très intéressant, mais qui nous laisse malheureusement avec ce problème de contrôler le duplicate de nos textes avant publication…

  15. Xavier from billets pas cher dit :

    Pas très encourageant tout ça.
    Positeo est bien pratique mais il me donne des résultats à chaque fois différents (pas de beaucoup mais…) pour un même texte…
    Article très intéressant en tout cas, j’attends avec impatience le prochain, avec le même titre mais sans le « ? » !

  16. gamer from jeux gratuits dit :

    Vous êtes drôles avec votre DC !
    Mais vous vous le générer vous même avec les flux RSS de vos sites, qui est repris par de nombreux sites et annuaires, un DC que vous voulez puisque vous poster votre flux, Alors si c’est le début d’un article, et bien une fois validé, il y aura autant de DC de votre début d’article qui il y a d’annuaires qui référencent votre flux, alors pour les diig like à 150 caractères, cela passe partout …
    Mais je pense que le lien est conservé et vous permet d’être l’origine de l’article …
    Sinon, a force de faire du contenu unique, il n’y aura plus rien d’unique ! tous les mots sont combinés dans tous les sens, et à ce que je lis, des logiciels le font à votre place …
    Mais je comprend aussi qu’un article soit copiés entièrement sans révéler la source est rageant, surtout lorsque l’on y passe du temps pour le faire…
    Tous les bons annuaires demandent des descriptions uniques, pourquoi je devrais les privilégier et pas d’autres qui peuvent être utile à mon référencement ? un backlink est un backlink …

  17. [...] primordiale est que l’annuaire (ou du moins son administrateur) se doit de contrôler le duplicate content à la soumission (et encore mieux : post soumission!). Il doit si possible proposer l’ajout [...]

  18. Dominique from Ebook affiliation dit :

    Bonjour,

    Moi j’utilise aussi positeo, ça arrive qu’il trouve dans un article par exemple 30% de DC et en faisant une recherche dans google je le trouve dupliqué à 100 % titre inclus, alors je ne comprends pas, je me demande si il y à vraiment un moyen efficace d’éviter le Duplicate content.

    A bientôt

Commenter cet article :
Leave a Reply






Anti-Spam Question:

Nous suivre
Rechercher dans le site
S'abonner a la newsletter
Retrouvez-nous sur facebook