Hoe werken zoekmachines?
Als je weet op welke manier zoekmachines aan hun data komen en op basis waarvan ze deze gegevens rangschikken in hun zoekresultaten kun je daarmee rekening houden tijdens het bouwen en inrichten van je website.
Als je weet op welke manier zoekmachines aan hun data komen en op basis waarvan ze deze gegevens rangschikken in hun zoekresultaten kun je daarmee rekening houden tijdens het bouwen en inrichten van je website.
Het doel van een zoekmachine is het indexeren (in kaart brengen) van websites die op het internet staan. Deze database van vele miljoenen websites dient als bron voor gebruikers van de zoekmachine om de informatie te vinden die zij zoeken. Maar hoe komen zoekmachines aan hun informatie? Op basis waarvan wordt de ranglijst van zoekresultaten opgesteld? Voordat we met de daadwerkelijke zoekmachine optimalisatie aan de slag gaan is het handig om te weten hoe zoekmachines werken.
Soorten zoekmachines
Globaal bestaan er twee soorten zoekmachines:
Crawler-gebaseerde zoekmachines zoals Google.
Deze zoekmachines gebruiken software (crawlers of spiders genaamd) die constant het internet afzoeken naar nieuwe websites die nog niet in hun index staan. Bovendien verzamelen ze updates van websites die al (gedeeltelijke) geïndexeerd zijn. Als een crawler veranderingen in je website vindt zal de zoekmachine index worden aangepast. Dit kan dan weer van invloed zijn op de ranking (de positie in de zoekresultaten) van je website.
Directories zoals Open Directory.
In tegenstelling tot crawler-gebaseerde zoekmachines zijn de websites die in directories vermeld staan allemaal bezocht en beoordeeld door mensen die (vrijwillig) als redacteur voor de directory werken. Wanneer je een zoekopdracht in een directory uitvoert zijn de zoekresultaten gebaseerd op de omschrijving van de site zoals die is aangemeld bij de directory. Directories updaten hun database niet zoals crawler-based zoekmachines dat doen. Als je je website bij een directory aanmeldt zal een redacteur je site beoordelen en op basis daarvan besluiten om hem op te nemen in de database of niet. Als je website eenmaal in de directory is opgenomen en je verandert de site dan zal dat geen invloed hebben op de ranking in de zoekresultaten van de directory.
Het is overigens belangrijk om je site aan te melden bij de belangrijke directories. Als je site eenmaal in die directories staat is de kans groter dat je site opgenomen wordt in crawler-gebaseerde zoekmachines. Omdat de sites die in directories staan door mensen zijn beoordeeld, gaan crawler-based zoekmachines ervan uit dat ze de moeite van het indexeren waard zijn. Open directory bijvoorbeeld, wordt onder andere gebruikt door AOL Search, Netscape Search, Google, Lycos en HotBot.
Indexering door crawlers/spiders
Crawler-based zoekmachines bestaan dus uit een crawler (of spider) die websites bezoeken en 'lezen'. Ze zullen vervolgens de interne links naar andere pagina's op die website volgen en indexeren. De crawler zal met zekere regelmaat de website bezoeken om veranderingen in kaart te brengen en zo de zoekmachine index up-to-date houden.
De informatie die de spider over je website verzameld wordt opgenomen in een index. Deze index kun je zien als een enorme database met een copy van iedere website die de spider vindt. Iedere keer als de crawler een verandering in een website vindt zal de zoekmachine index worden bijgewerkt.
Het wil overigens niet zeggen dat als een spider je site bezoekt alle pagina's meteen worden opgenomen in de database. Er kan dus een tijd overheen gaan voordat alle pagina's van je website worden geïndexeerd. Het kan ook voorkomen dat bepaalde pagina's in je website helemaal niet (kunnen) worden geïndexeerd. Hier kunnen veschillende reden voor zijn waar ik later op terug kom. Pas nadat een pagina geïndexeerd is zal die in de zoekresultaten van de zoekmachine kunnen worden opgenomen.
Als de pagina's van je website door de zoekmachine zijn geïndexeerd kunnen gebruikers met behulp van zoektermen de index doorzoeken. Op basis van die zoektermen zal de zoekmachine de index doorzoeken en een lijst van gevonden websites geven. In de meeste gevallen zal de zoekmachine op de eerste twee bladzijden van de zoekresultaten de site(s) tonen waarnaar je op zoek bent; een enorme prestatie als je bedenkt dat er letterlijk miljoenen pagina's doorzocht moeten worden!
Hoe werken crawlers?
Maar hoe bepalen zoekmachines wat relevant is? Aan de hand waarvan komen ze tot de rangorde in zoekresultaten? Zodra je dit weet kun je daar rekening mee houden en hier op inspringen bij het bouwen van je website en de inhoud (content) ervan. Om tot een zoekresultaat te komen gebruiken zoemachines verschillende reeksen instructies (algoritmen) om hun index te doorzoeken. Je kunt je voorstellen dat het een goedbewaard geheim is hoe deze algoritmen precies werken. Bovendien worden de algoritmen regelmatig aangepast. Er zijn echter een aantal standaard punten in een website waar zoekmachines naar kijken en waarop de uiteindelijke rangschikking mede op gebaseerd is.
Als iemand een zoekwoord of een reeks zoekwoorden in een browser intypt zal de zoekmachine in het gunstigste geval met duizenden resultaten komen. De meeste mensen zullen echter alleen de websites op de eerste pagina proberen. Als ze tussen deze eerste tien resultaten niet hebben gevonden waar ze naar op zoek zijn zullen ze een nieuwe zoekopdracht proberen. Het is dus zeer belangrijk om op die eerste pagina te komen voor de zoekwoorden die relevant zijn voor jouw website. De volgende tips kunnen je helpen met het bereiken van dit doel.
Soorten zoekmachines
Globaal bestaan er twee soorten zoekmachines:
Crawler-gebaseerde zoekmachines zoals Google.
Deze zoekmachines gebruiken software (crawlers of spiders genaamd) die constant het internet afzoeken naar nieuwe websites die nog niet in hun index staan. Bovendien verzamelen ze updates van websites die al (gedeeltelijke) geïndexeerd zijn. Als een crawler veranderingen in je website vindt zal de zoekmachine index worden aangepast. Dit kan dan weer van invloed zijn op de ranking (de positie in de zoekresultaten) van je website.
Directories zoals Open Directory.
In tegenstelling tot crawler-gebaseerde zoekmachines zijn de websites die in directories vermeld staan allemaal bezocht en beoordeeld door mensen die (vrijwillig) als redacteur voor de directory werken. Wanneer je een zoekopdracht in een directory uitvoert zijn de zoekresultaten gebaseerd op de omschrijving van de site zoals die is aangemeld bij de directory. Directories updaten hun database niet zoals crawler-based zoekmachines dat doen. Als je je website bij een directory aanmeldt zal een redacteur je site beoordelen en op basis daarvan besluiten om hem op te nemen in de database of niet. Als je website eenmaal in de directory is opgenomen en je verandert de site dan zal dat geen invloed hebben op de ranking in de zoekresultaten van de directory.
Het is overigens belangrijk om je site aan te melden bij de belangrijke directories. Als je site eenmaal in die directories staat is de kans groter dat je site opgenomen wordt in crawler-gebaseerde zoekmachines. Omdat de sites die in directories staan door mensen zijn beoordeeld, gaan crawler-based zoekmachines ervan uit dat ze de moeite van het indexeren waard zijn. Open directory bijvoorbeeld, wordt onder andere gebruikt door AOL Search, Netscape Search, Google, Lycos en HotBot.
Indexering door crawlers/spiders
Crawler-based zoekmachines bestaan dus uit een crawler (of spider) die websites bezoeken en 'lezen'. Ze zullen vervolgens de interne links naar andere pagina's op die website volgen en indexeren. De crawler zal met zekere regelmaat de website bezoeken om veranderingen in kaart te brengen en zo de zoekmachine index up-to-date houden.
De informatie die de spider over je website verzameld wordt opgenomen in een index. Deze index kun je zien als een enorme database met een copy van iedere website die de spider vindt. Iedere keer als de crawler een verandering in een website vindt zal de zoekmachine index worden bijgewerkt.
Het wil overigens niet zeggen dat als een spider je site bezoekt alle pagina's meteen worden opgenomen in de database. Er kan dus een tijd overheen gaan voordat alle pagina's van je website worden geïndexeerd. Het kan ook voorkomen dat bepaalde pagina's in je website helemaal niet (kunnen) worden geïndexeerd. Hier kunnen veschillende reden voor zijn waar ik later op terug kom. Pas nadat een pagina geïndexeerd is zal die in de zoekresultaten van de zoekmachine kunnen worden opgenomen.
Als de pagina's van je website door de zoekmachine zijn geïndexeerd kunnen gebruikers met behulp van zoektermen de index doorzoeken. Op basis van die zoektermen zal de zoekmachine de index doorzoeken en een lijst van gevonden websites geven. In de meeste gevallen zal de zoekmachine op de eerste twee bladzijden van de zoekresultaten de site(s) tonen waarnaar je op zoek bent; een enorme prestatie als je bedenkt dat er letterlijk miljoenen pagina's doorzocht moeten worden!
Hoe werken crawlers?
Maar hoe bepalen zoekmachines wat relevant is? Aan de hand waarvan komen ze tot de rangorde in zoekresultaten? Zodra je dit weet kun je daar rekening mee houden en hier op inspringen bij het bouwen van je website en de inhoud (content) ervan. Om tot een zoekresultaat te komen gebruiken zoemachines verschillende reeksen instructies (algoritmen) om hun index te doorzoeken. Je kunt je voorstellen dat het een goedbewaard geheim is hoe deze algoritmen precies werken. Bovendien worden de algoritmen regelmatig aangepast. Er zijn echter een aantal standaard punten in een website waar zoekmachines naar kijken en waarop de uiteindelijke rangschikking mede op gebaseerd is.
Als iemand een zoekwoord of een reeks zoekwoorden in een browser intypt zal de zoekmachine in het gunstigste geval met duizenden resultaten komen. De meeste mensen zullen echter alleen de websites op de eerste pagina proberen. Als ze tussen deze eerste tien resultaten niet hebben gevonden waar ze naar op zoek zijn zullen ze een nieuwe zoekopdracht proberen. Het is dus zeer belangrijk om op die eerste pagina te komen voor de zoekwoorden die relevant zijn voor jouw website. De volgende tips kunnen je helpen met het bereiken van dit doel.
| < Zoekmachine optimalisatie | Metadata en keywords > |
|---|


