De XML sitemap van een website zal Google helpen bij het crawlen van jouw website. In deze blogpost helpen wij jou graag om de plattegrond van jouw website verder te optimaliseren voor SEO. Deze onderwerpen komen aan bod:
- Wat is een XML Sitemap ?
- Hoe ziet een XML sitemap eruit?
- Is een XML sitemap belangrijk voor SEO?
- Adviezen voor een goede XML sitemap
- Interessante vragen over XML-sitemaps
.
Wat is een XML sitemap?
Een XML sitemap is een file waarin alle belangrijke URLs van een website zijn opgesomd. Het is bedoeld om zoekmachines een overzicht te geven van alle webadressen die op een site staan. Zo kunnen ze die gemakkelijk vinden en indexeren. Een goede XML sitemap helpt dus een website om sneller gevonden en geïndexeerd te worden door Google.
.
Hoe ziet een XML sitemap eruit?
De XML sitemap bevat de volgende onderdelen:
- Een XML-verklaring om crawlers duidelijk te maken welk type bestand & protocol ze aan het lezen zijn
- De URL: vermeldt het webadres van de verschillende (hoofd)-pagina’s.
- Last modified: een datum die vermeldt wanneer een URL voor het laatst is gewijzigd.
- Sommige sitemaps vermelden eveneens nog <priority>en <changefreq>: dat mag, maar hebben sinds enige tijd geen enkel effect.
Hieronder zie je een voorbeeld van de sitemap van Online Marketing Monkey. Ze is onderverdeeld in een aantal sub-sitemaps: 1 met alle berichten, 1 met met pagina’s, 1 met alle categorieën enz. Als je op 1 van deze subsitemaps doorklikt, krijg je de URLs te zien die eronder vallen.
.
Is een XML sitemap belangrijk voor SEO?
Zeker in de beginjaren van SEO waren XML-sitemaps een snelle manier om de engines nieuwe URLs te laten crawlen. Tegenwoordig is het SEO belang minder geworden.
In tegenstelling tot wat men vaak denkt, zijn XML-sitemaps echter geen SEO ranking factor. Maar hebben nog steeds hun nut: je site is gemakkelijk te crawlen, waardoor Google beter de interne links kan ontdekken, wat dan weer goed is voor je SEO.
.
Adviezen voor een goede XML sitemap
Suggereren is niet gelijk aan indexeren
Eerst en vooral, een XML-sitemap zal er niet automatisch voor zorgen dat jouw pagina’s geïndexeerd worden. Een sitemap-seo is een hulpmiddel voor zoekbots die jouw website crawlen. Deze zullen de pagina’s op jouw websites enkel effectief indexeren indien ze volgens hen kwalitatief genoeg zijn om dat te doen.
Wanneer je dus een XML-sitemap toevoegt aan Google Search Console doe je dus niets minder, maar zeker ook niets meer dan een suggestie aan Google over de pagina’s die het volgens jou waard zijn om geïndexeerd te worden.
Wees consequent
Zorg voor een heldere en vooral eenduidige boodschap richting de crawlers die het web crawlen. Wanneer je aan de ene kant een bepaalde pagina opneemt in het robots.txt-bestand om te verhinderen dat deze geïndexeerd wordt en aan de andere kant wel opneemt in de XML-sitemap, zaai je verwarring. Idem wanneer je voor bepaalde pagina’s meta robots instelt met “noindex, follow” om te verhinderen dat Google deze pagina’s na het crawlen ook indexeert, maar diezelfde pagina’s vervolgens wel doodleuk opneemt in de sitemap.
Houd rekening met het crawlbudget
Wanneer je heel veel pagina’s hebt die niet bedoeld zijn als landingspagina’s kan je er meta robots “noindex,follow” aan toekennen. Weet dan dat je dreigt heel wat van het crawlbudget te laten gebruiken om deze pagina’s te crawlen en de Google bots eenvoudigweg niet meer toekomt aan die pagina’s waarvan het voor jou wel belangrijk is dat ze geïndexeerd worden. In die optiek is het gebruik van een robots.txt-bestand waarin je alle niet-contentmatige pagina’s opneemt interessanter
Maak meerdere XML-sitemaps
Heb je bijvoorbeeld van een webshop met meer dan 200.000 producten en 100den honderden productcategoriepagina’s en nog eens een veelvoud aan subcategoriepagina’s. Je gooit alles in één sitemap en ziet vervolgens in Google Search Console dat zo’n 80.000 pagina’s geïndexeerd werden, maar welke pagina’s?
Je wil tegelijk ook weten:
- hoeveel daarvan productcategoriepagina’s zijn,
- hoeveel subcategoriepagina’s,
- hoeveel individuele productpagina’s?
Vandaar is het interessanter om meerdere subsitemaps of index-sitemappen aan te maken. Verder is het ook gebruikelijk de index-sitemaps niet te groot te maken (1000 URLs max) zodat ze gemakkelijker kunnen worden ingelezen door de bots.
Als je nu voor bijvoorbeeld de sitemap van de subcategoriepagina’s ziet dat Google niet alle pagina’s ïndexeert, kan je specifieker gaan werken op bepaalde type pagina’s.
Ga de pagina’s die jij graag zou laten indexeren onder verdelen in verscheidene sitefolders met een aantal theorieën in gedachten:
- Pagina’s die geen productfoto hebben, worden niet geïndexeerd,
- Pagina’s met dan 200 woorden ook niet,
- Evenmin pagina’s zonder reviews
Maak nu sitemaps met een voldoende aantal pagina’s die in één van de bovengenoemde categorieën thuishoort.
Vervolgens kan je gaan kijken naar het percentage van pagina’s uit een sitemap dat geïndexeerd zijn. Op die manier kan je sneller zien welke factoren ervoor zorgen of een pagina al dan niet geïndexeerd is.
Van zodra je weet waar het schoentje wringt kan je ofwel de content gaan aanpassen ofwel voeg je een noindex toe indien het sop de kolen niet waard is. Vergeet bij het gebruik van noindex, ze ook niet uit de sitemap te verwijderen
Eén zwaluw maakt de SEO-lente niet
Weet dat Google de kwaliteit van jouw ganse website bekijkt om deze te ranken.
Stel dat jouw website een paar steengoede pagina’s heeft waarop mensen vanuit de zoekresultaten landen. Maar wat als ze vervolgens doorklikken naar andere pagina’s op jouw website die helemaal niet bedoeld zijn als landingspagina. Zoals log-in pagina’s, pagina’s om te reageren op commentaren, een paswoord te recupereren, …Pagina’s die wel degelijk hun gebruiksnut hebben, maar door de ‘Googlebril’ niet als evenwaardig aan contentpagina’s aanzien worden.
Bij het maken van een XML-sitemap kan je er dus deze pagina’s maar beter tussenuit laten. Geef in de sitemap die pagina’s mee waarvan jij overtuigd bent dat ze goede content bevatten. Op die manier scheidt je al het kaf van het koren en maak je duidelijk aan de Google bot dat je wel degelijk weet welke pagina’s voldoende goede content hebben om in de XML-sitemap te komen en welke niet. Op basis van de pagina’s die de bot in jouw XML-sitemap terugvindt zal hij jouw website beoordelen en ranken.
Onterecht geïndexeerde pagina’s
Met de XML-sitefolder kan je dus zoals al eerder gezegd wel een suggestie doen aan Google van wat jij denkt dat waardevolle pagina’s zijn, maar dat belet de bots niets om ook andere pagina’s op jouw website te crawlen en deze te indexeren (tenzij deze in je robots-txt bestand zitten of je er een meta robots voor toegevoegd hebt).
Er bestaat met andere woorden wel degelijk nog een kans dat bots pagina’s, waarvan je het liever niet hebt, crawlen en indexeren
Om deze volgens jou onterecht geïndexeerde pagina’s terug te vinden kan je in Google zoeken op site: gevolgd door de url van jouw website. De pagina’s die volgens jou niet in dit overzicht thuishoren, kan je een meta robots “noindex,follow” geven of toevoegen aan je robots.txt-bestand. De zwakste schakels vind je meestal op de laatste pagina van deze zoekresultaten.
.
Interessante vragen over XML-sitemaps
Een html user sitemap is een aanklikbaar html overzicht van alle URL’s die aanwezig zijn op een website. Het is bedoeld om “menselijke” websitebezoekers een algemeen overzicht van de alle site-pagina’s te bezorgen. Een XML sitemap daarentegen is bestemd om zoekmachines een algemeen beeld van de URLs op de site te geven.
Er zijn een aantal goede sitemap tools op de markt aanwezig, zoals deze van Screaming Frog en XML-Sitemap.com. Daarnaast bevatten de meeste CMS-en (Content Management Systemen) plugins om de XML aan te maken. Zo is Yoast waarschijnlijk wel de bekendste plugin voor WordPress.
Voor kleinere websites (< 1000 URLs) met beperkt development budget is het geen absolute must. Google is heden ten dage meestal slim genoeg ook zonder de sitemap haar weg te vinden op een kleinere site. Voor grote websites zijn ze volgens Google wel een minimum SEO vereiste.
Je SEO & XML sitemappen eens grondig laten analyseren? Neem dan gerust eens vrijblijvend contact met ons op!