Sitemap, wat is dat? #

Het internet is een collectie van pagina’s die via hyperlinks met elkaar verbonden zijn. Een website is een kleinere collectie van pagina’s die eveneens naar elkaar toe linken. Webcrawlers indexeren pagina’s die online staan en niet beveiligd zijn met een wachtwoord of op andere wijze afgeschermd zijn.

Met een sitemap wordt het eenvoudiger om de structuur en inhoud van een pagina te bepalen. Het is niet de enige methode die crawlers gebruiken om websites te lezen, het kan wel een toegevoegde waarde leveren aan de indexatie voor zoekmachines.

Hoe werkt een sitemap? #

Veel websites hebben een boomstructuur. Denk aan een hoofdpagina, categorieën, subcategorieën en productpagina’s. Een webcrawler volgt deze links zoals je die als gebruiker ook zou kunnen volgen. Als de crawler op voorhand niet weet wat te verwachten is er meer tijd nodig dan met een ‘kaart’ die de route aangeeft.

Dit betekent dat er kostbare tijd verloren gaat wat kan betekenen dat informatie niet of onvolledig geïndexeerd wordt. Aan de hand van een sitemap weet de crawler ongeveer welke informatie er op de website staat. Het zoekalgoritme vaart niet blind op deze informatie maar voert een verificatie uit waarmee het proces veel sneller verloopt.

Welke informatie is nuttig voor een sitemap? #

Naast de structuur en indeling van de website biedt het ook voordeel als het algoritme kan zien om welk type content het gaat. Daarbij kun je video, afbeeldingen en nieuwswaardige informatie in de sitemap opnemen.

Met name nieuws is een belangrijk criterium. Als er namelijk een nieuwswaardig bericht gepubliceerd wordt dan moet dit snel vindbaar zijn in zoekmachines.

Welke informatie kan worden opgenomen?

  • Video: De speelduur, categorie en leeftijdsklasse.
  • Afbeelding: Het onderwerp, bestandsformaat en auteursrechtelijke licentie.
  • Nieuws: De titel van het bericht en de datum van publicatie.

 

Als de koppelingen op een website juist zijn dan is het niet strikt noodzakelijk om een sitemap te genereren. De webcrawlers kunnen alle openbaar toegankelijke content op een server indexeren. Als de website echter zeer groot is met een enorm aantal pagina’s dan kan een sitemap veel speurwerk besparen.

Als de link structuur afwijkt van de norm dan kan voorkomen worden dat er pagina’s worden overgeslagen. Video’s en afbeeldingen zijn op een los tabblad te vinden in de zoekresultaten van Google, door ze als zodanig aan te merken worden ze beter vindbaar in de zoekmachine.

Hoe maak je een sitemap? #

Google biedt ondersteuning voor sitemaps in XML, RSS, mRSS, Atom 1.0 en Text formaat. Daarbij moet het standaard sitemap protocol gebruikt worden. Het <priority> attribuut wordt niet gelezen door Google. Een sitemap kan handmatig opgesteld worden, meestal betreft het een automatisch gegenereerd bestand.

Er is een limiet van 50 MB ongecomprimeerde data en een maximaal aantal van 50.000 URL’s. Als de website groter is dan moeten er meerdere sitemaps gemaakt worden. Binnen een sitemap index bestand kan naar afzonderlijke maps verwezen worden.

Nadat de indexering is afgerond kan deze worden ingediend bij Google. Standaard wordt een sitemap eenmaal uitgelezen. Bij wijzigingen wordt aanbevolen om dit door te geven bij Google.

Handig artikel voor je?
Updated on juli 20, 2022