Duplicate content: alles over de problemen én oplossingen

Duplicate content is een regelrechte SEO-nachtmerrie voor je website.

Of valt het allemaal wel mee?

Over duplicate content bestaan in ieder geval heel wat misverstanden.

Hoog tijd voor een blog/podcast over dit onderwerp! Lees/luister snel verder en ontdek:

  • Wat duplicate content is
  • Hoe het ontstaat
  • Wat de (negatieve) gevolgen zijn
  • Hoe je duplicate content kan detecteren, vermijden én oplossen

Wat is duplicate content

Duplicate content is een term die je vaak tegenkomt als je leest over SEO.

Maar was is duplicate content eigenlijk?

Duplicate content is content/tekst die op meerdere webpagina’s/URL’s staat. Duplicate content noemen we ook wel dubbele content of dubbele inhoud.

Duplicate content kan intern zijn (meerdere pagina’s op je eigen website met dezelfde inhoud) of extern (dubbele content op verschillende domeinen).

Google geeft de volgende definitie van duplicate content/dubbele inhoud:

“Dubbele inhoud verwijst gewoonlijk naar substantiële blokken inhoud binnen of tussen domeinen die ofwel volledig gelijk zijn of aanzienlijk op elkaar lijken.”

Bron: Google

Enkele gekopieerde regels tekst op een webpagina is dus nog geen duplicate content. Het moet gaan om “substantiële blokken”.

Waar de grens precies ligt om van “substantieel” te spreken, is niet duidelijk. Er is in ieder geval sprake van duplicate content als (vrijwel) de volledige webpagina een kopie is.

Hoe ontstaat duplicate content?

Duplicate content kun je natuurlijk bewust zelf maken.

Door bijvoorbeeld zelf meerdere pagina’s op je website te maken met dezelfde tekst (wat over het algemeen trouwens niet aan te raden is).

Of door een pagina van een andere website helemaal over te nemen op je eigen website. Dit gebeurt op grote schaal bij webshops. Als je honderden artikelen in je webshop hebt staan, is het lastig om daar allemaal teksten voor te gaan schrijven. Veel webshops nemen dan alle teksten over van de leverancier. Waardoor tig webshops met dat product allemaal dezelfde tekst hebben.

Duplicate content webshops zoekresultaten
Dezelfde teksten op meerdere websites

Maar wist je dat duplicate content ook onbewust kan ontstaan, soms zonder dat je er zelf erg in hebt?

Duplicate content en URL’s

Dat kan gebeuren, omdat er sprake is van duplicate content als dezelfde inhoud op meerdere URL’s staat. En een website maakt vaak vanzelf meerdere URL’s aan voor dezelfde content.

Denk bijvoorbeeld aan:

  • Een printversie van een blogartikel met een eigen URL
  • Unieke session ID’s in URL’s die worden gekoppeld aan bezoekers
  • Artikelen die in meerdere categorieën staan en op die manier toegankelijk zijn via verschillende URL’s
  • URL’s die worden gegenereerd voor dezelfde content door gebruik van filters in een webshop

Zo kan het dus makkelijk gebeuren dat een en dezelfde productpagina toegankelijk is via meerdere URL’s. Bijvoorbeeld een webpagina voor een zonnebril met de volgende URL’s:

  • mijnwebshop.nl/zwarte-zonnebrillen/zonnebril-88
  • mijnwebshop.nl/nieuwste-zonnebrillen/zonnebril-88
  • mijnwebshop.nl/modieuze-zonnebrillen/zonnebril-88

Gevolgen van duplicate content

Maar nu is de vraag: hoe erg is dat eigenlijk, die duplicate content?

Moet je in paniek raken of valt het allemaal wel mee?

via GIPHY

Laat ik je maar gelijk geruststellen. Er is geen reden tot paniek.

Duplicate content wil je het liefst zo veel mogelijk vermijden. Maar als er her en der wat duplicate content op je site staat, is dat geen reden om je grote zorgen te maken.

Matt Cutts van Google gaf eind 2013 aan dat 25 tot 30% van het web duplicate content is. Het is een veelvoorkomend verschijnsel en Google gaat hier inmiddels redelijk goed mee om.

Google filtert de duplicate content eruit

Het belangrijkste gevolg van duplicate content is dat de zoekmachine de duplicate content (grotendeels) eruit filtert.

Je kunt je voorstellen dat een gebruiker er niet op zit te wachten om allerlei dezelfde webpagina’s in de zoekresultaten te zien.

Google laat dus in principe alleen de originele versie van de webpagina in de zoekresultaten zien. Alle duplicaten van die webpagina laat Google simpelweg niet zien.

Op zich niet zo’n ramp dus. Het enige dat er gebeurt is dat je duplicate content niet wordt getoond in de zoekresultaten.

Google heeft op zijn blog zelfs wel eens aangegeven dat je je helemaal geen zorgen hoeft te maken over duplicate content en dat de zoekmachine dat zelf allemaal goed kan beoordelen en afhandelen:

Google wants to serve up unique results and does a great job of picking a version of your content to show if your sites includes duplication. If you don’t want to worry about sorting through duplication on your site, you can let us worry about it instead.

bron: Google webmaster central blog

Maar, er is ook een andere kant van het verhaal…

In de praktijk is het altijd goed om duplicate content zo veel mogelijk te vermijden. Ook al gaat de zoekmachine er goed mee om, volgens sommige SEO-specialisten kan het namelijk in bepaalde gevallen wel degelijk negatieve effecten hebben.

1 – Google laat de verkeerde versie zien

Google filtert duplicate content uit de zoekresultaten en laat in principe maar 1 pagina zien.

En dat kan dan net de versie zijn die jij liever niet in de zoekresultaten ziet (bijvoorbeeld: Google kiest de printversie van het artikel, terwijl jij liever de normale versie van het artikel in de zoekresultaten zou zien).

2 – Mogelijk lagere rankings

Google kan in principe duplicate content goed afhandelen en zorgen dat je website er niet onder lijdt. Maar toch wordt er wel gewaarschuwd dat duplicate content kan leiden tot lagere rankings.

Dat zou dan bijvoorbeeld kunnen gebeuren omdat andere websites naar verschillende versies van je duplicate content gaan linken. In plaats dat alle links naar 1 unieke pagina leiden, gaan ze naar verschillende duplicate-pagina’s, waarmee de SEO-kracht van die links wordt verdeeld over alle duplicates. Dan scoor je lager in de zoekresultaten dan wanneer je maar 1 unieke pagina op je website had gehad.

Google zegt zelf dat het geen negatief effect heeft, omdat ze alle signalen zoals linkkracht consolideren naar de ene pagina die ze tonen in de zoekresultaten. Maar dat is de theorie en het blijft de vraag of het in de praktijk altijd goed werkt.

3 – Verspilling van crawl budget

Google gebruikt een crawl budget. Dat is het aantal pagina’s op je website dat de Googlebot bekijkt of crawlt elke keer als hij langskomt.

Voor kleine sites is dit niet zo’n issue, maar heb je een hele grote site, dan is dat crawl budget wel van belang. Als je heel veel duplicate content op je website hebt staan, dan verspilt de zoekrobot zijn crawl budget aan al die duplicate content. En dat is zonde!

Duplicate content en crawl budget
Google-medewerker Gary Illyes geeft aan dat duplicate content crawl budget kan verspillen

4 – Een penalty (als je het heel bont maakt)

Zoals je hierboven ziet in de tweet van Gary Illyes, heeft Google geen penalty voor duplicate content. Maar als je het heel bont maakt met duplicate content, kun je wel een penalty krijgen voor spam.

In de zeldzame gevallen waarin Google merkt dat dubbele inhoud wordt weergegeven met de bedoeling onze rangschikking te manipuleren en onze gebruikers te misleiden, zullen we ook de juiste aanpassingen aanbrengen in de indexering en rangschikking van de betreffende sites. Dit kan een nadelig effect hebben op de positie van de site of de site kan worden verwijderd uit de index van Google en daardoor niet meer in zoekresultaten worden weergegeven.

Bron: Google

Je moet het wel heel bont maken, wil Google vinden dat je bezig bent met manipuleren en misleiden. Daar zou bijvoorbeeld sprake van kunnen zijn als vrijwel je volledige website bestaat uit duplicate content.

Uitkijken met externe duplicate content

Er wordt heel wat gecopy-paste op het internet.

Misschien kom je zelf ook wel eens een artikel op een andere website tegen en denk je: hee, dat artikel zou ook goed passen op mijn eigen website.

Een artikel overnemen van een andere website is prima, zo lang je daar maar de volgende twee dingen bij bedenkt:

  1. Je hebt (in principe) geen SEO-voordeel van content die je van andere websites overneemt. Google laat normaal gesproken alleen het originele artikel zien, dus de gekopieerde pagina op jouw website wordt niet (of heel erg laag) getoond in de zoekresultaten.
  2. Je moet altijd toestemming vragen aan de website waar je de content van wilt overnemen.

Mensen denken soms nog wel eens dat je alles op internet gewoon mag overnemen, omdat het openbaar is. Maar zo werkt het toch echt niet.

De maker van (online) content heeft het auteursrecht op zijn werk en dit mag je niet zomaar kopiëren. Op de site van Charlotte’s Law kun je meer lezen over auteursrecht.

Neem je content van een andere website over zonder toestemming? Dan kan je dat een hele hoop ellende opleveren, tot aan rechtszaken en torenhoge schadeclaims toe.

Vraag dus altijd netjes toestemming. Krijg je die, zet dan ook een link bij je artikel naar het origineel. Op die manier geef je credit aan de maker.

Hoe kun je duplicate content opsporen?

Als je duplicate content wilt oplossen, moet je het natuurlijk eerst zien te vinden! Gelukkig zijn daar verschillende tools/manieren voor.

Zoeken in Google

Een simpele manier om te zoeken naar duplicate content is om een stukje tekst van een pagina te pakken en daarop te zoeken in Google.

Zet het stukje tekst tussen aanhalingstekens. Dan zoekt Google naar pagina’s op het web met dat volledige stukje tekst achter elkaar.

Checken op duplicate content met een Google search.
Checken op duplicate content met een Google search

Tools

Er zijn verschillende tools om duplicate content mee op te sporen, zoals:

Voer bijvoorbeeld een URL in Copyscape in:

Checken in Copyscape

Dit artikel op Frankwatching geeft 1 resultaat. Als we op dat resultaat klikken, zien we dat 21% van het artikel gekopieerd is op een andere website.

Percentage duplicate checken met Copyscape.

Het duplicaat-artikel vermeldt onderaan dat de bron Frankwatching is. Kennelijk hebben ze toestemming gevraagd om een gedeelte van het artikel over te nemen.

Hoe kun je duplicate content voorkomen

Als je geen duplicate content op je site hebt, hoef je het ook niet op te lossen. Voorkomen is beter dan genezen :). Dat doe je door vooral unieke content te plaatsen.

Maak unieke content

Google waardeert unieke, relevante en originele content.

Heb jij dit nauwelijks op je website omdat je veel duplicate content hebt? Dan zul je het in de zoekmachine-rankings waarschijnlijk niet zo goed gaan doen…

Content kopiëren van andere websites mag best, als dit waardevol is voor je lezers en als je toestemming hebt van de oorspronkelijke auteur. Maar als een groot deel van je website bestaat uit gekopieerde content, bied je geen toegevoegde waarde en zal je site slecht zichtbaar zijn in Google.

Focus dus voornamelijk op het maken van unieke content. Je lezers en Google zullen je ervoor belonen!

Duplicate content oplossen

Heb je duplicate content op je website staan?

Dan kun je het op de volgende manieren oplossen.

1 – Pas 301-redirects toe

Heb je meerdere dezelfde pagina’s op je website staan? Maak dan een 301-redirect van alle duplicate pagina’s naar de originele pagina.

Als een bezoeker nu de URL van een duplicate pagina invoert in de browser, wordt hij automatisch netjes doorgestuurd naar de originele URL.

Met een 301-redirect wordt ook de waarde van de duplicate pagina’s doorgegeven aan de originele pagina. Zo maak je een betere kans om hoog te scoren in Google met je originele pagina!

Je kunt een 301-redirect maken met een plugin (bijvoorbeeld Redirection voor WordPress) of via je htaccess-bestand.

2 – Gebruik canonicals

Met een canonical-tag laat je zoekmachines weten dat een pagina een duplicaat is.

Als je een canonical op een pagina zet, zeg je tegen Google: “Dit is een duplicaat. De originele pagina vind je op deze URL….”.

Net als bij de 301-redirect, wordt alle SEO-waarde van de duplicate pagina’s doorgestuurd naar de originele pagina. Het verschil met de 301-redirect is dat de duplicate pagina met een canonical gewoon te bekijken is. Een bezoeker wordt dus niet automatisch naar de originele URL doorgestuurd, zoals bij een 301-redirect.

De canonical tag staat in de broncode van de pagina. Als je WordPress gebruikt, kun je hem makkelijk toevoegen met de plugin Yoast SEO.

Een canonical invullen met Yoast SEO

Duplicate content: samenvatting en actiepunten

Van duplicate content hoef je niet in paniek te raken.

Google gaat er steeds beter mee om en een penalty krijg je er niet voor (tenzij je het heel bont maakt).

Wel is het zaak om duplicate content zo veel mogelijk te vermijden. Dat Google er goed mee omgaat is theorie, maar in de praktijk kunnen er toch nog wat negatieve effecten zitten aan duplicate content:

  • Google laat de verkeerde versie zien in de zoekresultaten
  • Mogelijk lagere rankings
  • Verspilling van crawl budget
  • Een penalty voor spam (maar alleen in extreme gevallen, als vrijwel je gehele website uit gekopieerde content bestaat)

Staat er ook op jouw website duplicate content? Je kunt het opsporen met tools als Copyscape, Siteliner en Duplichecker.

Duplicate content kun je zo voorkomen/oplossen:

  • Unieke content maken
  • 301-redirects
  • Canonicals

Maak jij je nog zorgen over duplicate content of heb je vragen? Zet ze hieronder in de comments!

Altijd op de hoogte van de laatste podcast?

Click Here to Leave a Comment Below 0 comments

Leave a Reply: