En quoi consiste le contenu dupliqué ?

Par « contenu dupliqué », on entend un contenu identique qui est présent sur différentes pages internet. Cela peut avoir lieu sur un même site. Le contenu dupliqué vaut autant pour des paragraphes entiers que certaines parties d’un texte. Cette technique revêtait auparavant une connotation positive, car elle permettait de valoriser autant un site que l’autre.

Néanmoins, les moteurs de recherche actuels ne choisissent qu’une seule des deux pages, ce qui peut être désavantageux pour le référencement d’un site. Les moteurs de recherche sont devenus suffisamment performants pour pouvoir sélectionner le site web sur lequel le contenu se trouvait à l’origine. La question du contenu dupliqué pose une question éthique beaucoup plus ancienne qui est celle du plagiat, au cas où la duplication n’a pas été effectuée par la même personne.

Du contenu dupliqué s’est retrouvé sur internet en raison du fait que les anciens moteurs de recherches réagissaient positivement à cette pratique.  La technique privilégiée aujourd’hui est appelée « content spinning », ce qui consiste à rédiger des textes différents avec des contenus similaires. Un contenu dont le fond est similaire mais la forme est différente restera toujours valorisé par un moteur de recherche.

Je déconseille également cette pratique qui ne produit que rarement des résultats satisfaisant, à moins de finalement reprendre le texte dans sa globalité. Il est préférable de créer des contenus originaux, si vous souhaitez mettre votre site en évidence. La durée de travail n’en est finalement pas beaucoup plus importante, à condition d’écrire sur un sujet qui vous intéresse et/ou que vous connaissez.

Pourquoi est-il important de l’éviter ?

En cas de plagiat, le contenu dupliqué est punissable par la loi. Les moteurs de recherche ne donnent pas seulement moins d’importance aux sites présentant du contenu dupliqué, dans bien des cas, les moteurs de recherche excluent ces sites complètement. Il se peut aussi que le contenu dupliqué soit produit de manière involontaire. L’utilisation de sources identiques peut produire des textes fortement similaires. Il est donc toujours important de faire des recherches sur les contenus existants avant de rédiger un texte pour votre site web.

Certains outils permettent de prendre connaissance de la présence de contenu dupliqué sur votre site web. C’est par exemple le cas de Google Webmaster tools. Cette recherche peut aussi être effectuée manuellement sur Google au moyen de passages précis d’un texte.
En cas de présence de pages au contenu identique sur un même site web, il est possible d’aiguiller un moteur de recherche au moyen du terme « canonical » utilisé au niveau du code HTML de la page. Si vous souhaitez publier un contenu précis sur votre site web, alors que ce contenu est déjà présent ailleurs sur internet, il est important de retravailler le texte de fond en comble au niveau de sa structure. Si le style vous appartient, le contenu sera considéré comme original. Un contenu qui n’est modifié que superficiellement peut être associé à du contenu dupliqué par un moteur de recherche.

Le programme « Google Webmaster Tool » permet aussi de contester le fait qu’une page soit associée à du contenu dupliqué, si vous estimez qu’il s’agit d’une erreur de la part du moteur de recherche… Il est aussi possible de vous plaindre de cette manière si vous considérez que vos droits sont bafoués en raison d’un plagiat.