Metadata, wat is dat?

Hoewel de term ‘metadata’ doorgaans wordt geassocieerd met zoekmachine optimalisatie en internet in het algemeen, bestaat het al veel langer.

Zo stonden er vroeger in bibliotheken lange rijen met bakken met daarin kaartjes waar metadata op stond over boeken. Denk aan auteur, titel en onderwerp om zo snel een boek of informatie over dit boek te vinden. Het concept van metadata bleek ook heel nuttig om toe te passen op computersystemen. Die hebben moeite met context te bepalen, ze kunnen echter wel goed overweg met verifieerbare data.

Metadata kan beschrijvend van aard zijn, om structuur aan te brengen of om grote hoeveelheden data te categoriseren.

De eerste keer dat de term ‘metadata’ werd gebruikt in context van digitaal bestandsbeheer was in 1968. Philip Bagley gebruikte het om data over data te beschrijven, dit is de traditionele definitie uit het analoge tijdperk.

Metadata op het internet #

De tijd van papieren kaartjes in de bibliotheek is op enkele oude archieven na verleden tijd. Het internet heeft digitale data wereldwijd toegankelijk gemaakt, deze grote hoeveelheden data moeten wel verwerkt worden.

Zoekmachines hebben internetgebruikers geholpen om die naald in een hooiberg te vinden. Voor die tijd moesten we het doen met directe koppelingen en websites zoals Startpagina.nl met snelkoppelingen die handmatig in categorieën ingedeeld waren.

Zoekmachines konden dit proces automatiseren. Met webcrawlers wordt informatie van websites gescand om zo een zoekopdracht te matchen bij een webpagina. Metadata zorgt ervoor dat de crawlers snel en efficiënt informatie kunnen opvragen zonder de pagina volledig te analyseren.

Relevante informatie in de metadata #

Letterlijk betekent metadata ‘data over data’. Het biedt informatie over content. Zo kan het onderwerp van de pagina worden beschreven, aan de hand van keywords weet een webcrawler waar de pagina over gaat. De webmaster geeft dus informatie aan het algoritme van de zoekmachine om zo pagina’s vindbaar en indexeerbaar te maken. Het kan ook gebruikt worden om zaken aan te duiden zoals datum van plaatsing, bestandsformaat, auteur of versie nummer.

Misbruik van metadata #

Omdat internet zoekmachines rond de eeuwwisseling nog behoorlijk rigide waren zonder ruimte voor contextualisering bleek het eenvoudig om op basis van metadata hoog in de zoekresultaten te komen door de juiste termen te gebruiken. Er werd niet gekeken naar de werkelijke inhoud van de pagina.

Daardoor was het mogelijk dat de bovenste zoekresultaten totaal niet relevant waren in relatie tot de zoekopdracht. Met name Google zou diverse updates uitbrengen om dit gat te dichten, en steeds meer contextuele criteria in het zoekalgoritme opnemen.

Geen Black Hat SEO meer #

Volgens Google wordt er niet meer gekeken naar meta zoektermen in de metadata, toch zijn er experts die vermoeden dat deze informatie nog steeds als ondersteunend element geïndexeerd wordt. Hardware en software is krachtiger en geavanceerder geworden waardoor nu volledige pagina’s gescand kunnen worden.

Daarmee is het veel moeilijker geworden om de ranking te beïnvloeden met keywords en andere ‘Black Hat SEO’ trucs. Als het zoekalgoritme vermoedt dat er manipulatie in het spel is dan kan een webpagina bestraft worden met een lagere ranking of zelfs volledige verwijdering uit de zoekresultaten.

Handig artikel voor je?
Updated on October 12, 2021