Duplicate content

Door Martin Vellinga

Duplicate content, het houdt nooit op..

Het komt voor dat dezelfde content op meerdere webpagina’s te vinden is. Daar kunnen meerdere redenen voor zijn. Zo kan een YouTube video link embed worden op meerdere pagina’s, in dit geval is er nog steeds sprake van één unieke bron.

Het is ook mogelijk dat een netwerk van lokaal gerichte nieuwssites content deelt (syndicatie), in dat geval betreft het een centrale distributie naar meerdere kanalen binnen een netwerk. Dan zijn er bijvoorbeeld nog afbeeldingen uit een rechtenvrije bibliotheek die zonder modificatie gebruikt worden.

En er zijn ook nog websites die content ‘scrapen’ om deze zonder toestemming van de oorspronkelijke auteur te publiceren als eigen data.

Met andere woorden; een flink deel van het internet kan onder de noemer Duplicate content geschaard worden.

Hoewel een groot deel hiervan bewust gedupliceerd wordt met toestemming kan dit nog steeds van invloed zijn op zoekmachine optimalisatie.

Canonicalization van Duplicate content

Wanneer er meerdere pagina’s op een domein staan met grotendeels dezelfde content, kunnen deze pagina’s elkaar tegenwerken in de zoekmachine indexatie. In plaats van meerdere webpagina’s publiceren die onderaan in de zoekresultaten komen te staan, is het doorgaans beter om één pagina te promoten. Dit is mogelijk via canonicalization, een methode om de URL met voorkeur aan te duiden. Het zoekalgoritme zal de kopieën nietindexeren als afzonderlijke pagina’s maar als afgeleide content met een aantoonbare bron.

Google zoekt het zelf uit

Het is mogelijk om een webpagina in normale versie aan te bieden en in een printvriendelijke layout. De inhoud van de pagina’s is verder gelijk, alleen de weergave is anders. Het is dan een optie om de printer versie te voorzien van een ‘noindex’ metatag, zodat het zoekalgoritme weet dat het een bewuste keuze betreft.

Wanneer dit niet het geval is zal het algoritme dit doorgaans zelf kunnen bepalen, en zelf de meest voor de hand liggende versie kiezen voor opname in de zoekresultaten. Google wil namelijk liever unieke resultaten weergeven dan steeds dezelfde pagina in een iets afwijkende vorm.

6 methoden om Duplicate content te vermijden in zoekmachines:

Zorg ervoor dat interne link structuur consistent is.
Top-level domeinen zoals een .nl domein worden meer betrouwbaar geïndexeerd als een .com/nl pagina.
Bij websites die opnieuw ingedeeld zijn met kopieën van pagina’s kan met 301 Redirects worden aangegeven waar de nieuwe, permanente locatie zich bevindt.
Bij syndicatie kan het voordelig zijn om de bron aan te duiden met een blacklink, of een noindex tag toe te voegen.
Let op met gekopieerde tekst zoals algemene voorwaarden en plaats deze op een losse pagina.

Bij soortgelijke pagina’s wordt aanbevolen om de twee pagina’s samen te voegen of de content juist verder uit te breiden met als doel iedere webpagina uniek te maken.

Bedrog met kopieën

Zoekmachine optimalisatie die plaatsvindt volgens de SEO richtlijnen van Google kan een hogere positie in de zoekresultaten tot stand brengen. Wanneer er bewust gemanipuleerd wordt met pagina’s om de indeling te beïnvloeden, op een wijze die niet voldoet aan de richtlijnen, kan Google besluiten om deze pagina’s een minder voordelige ranking toe te kennen of zelfs geheel uit te sluiten van indexatie. Het is daarom van belang voor de webdeveloper om zich aan de richtlijnen te houdentoe te voegen.

Let op met gekopieerde tekst zoals algemene voorwaarden en plaats deze op een losse pagina.

relevante artikels

Zoekmachine Optimalisatie