Handleiding: Google PageRank werking uitgelegd

Handleiding: Google PageRank werking uitgelegd

PageRank is altijd het paradepaardje geweest van Google, bedacht door de oprichters van Google en vernoemt naar één van hen (Larry Page).

PageRank was in de beginjaren dan ook de kern van Google’s zoekmachine en daar dankt PageRank z’n populariteit aan.

Maar is die populariteit ook nu nog terecht? En hoe werkt PageRank eigenlijk? Lees hieronder mijn uitgebreide uitleg en antwoorden op deze en andere vragen over Google PageRank.

Laatste PageRank update
De laatste PageRank update vond plaats in december 2013. Let op: dit was de ‘Toolbar PageRank’, die sinds maart 2016 niet publiek beschikbaar wordt gesteld door Google. De zoekmachine gebruikt intern echter nog wel de “echte” PageRank score.

Samenvatting

Laat ik beginnen met een samenvatting van deze Google PageRank handleiding, inclusief verwijzingen naar specifieke onderdelen:

  • Wat is PageRank? Een nummerieke waarde die Google aan elke individuele pagina toewijst.
  • Elke link is een stem van de ene naar de andere webpagina, maar niet elke stem (link) is even belangrijk.
  • De echte PageRank waarde is alleen bij Google bekend. Wij zien een cijfer op een schaal van 1 t/m 10.
  • PageRank berekent Google met een formule. Elke nieuwe berekening is een PageRank update.
  • Niet alle links tellen mee in de PageRank berekening.
  • Het is aannemelijk dat de PageRank formule is aangepast en verbeterd.
  • Er zijn enkele PageRank misverstanden. Zo kijkt PageRank niet naar relevantie (bijvoorbeeld de linktekst).
  • Negeer PageRank gerust. Het zegt niets over de relevantie of vindbaarheid van je website.

Maar laten we bij het begin beginnen: wat is Google PageRank eigenlijk?

Wat is Google PageRank?

We beginnen bij het begin: wat is PageRank? Ik definieer PageRank als volgt:

PageRank is een nummerieke waarde die Google aan alle bij Google bekende individuele webpagina’s toewijst, op basis van de naar een webpagina verwijzende links, om te bepalen hoe belangrijk deze webpagina’s zijn ten opzichte van elkaar.

Merk dus op dat PageRank wordt toegewezen per individuele URL en niet per website. Een URL is meestal een webpagina, maar kan ook een afbeelding of een ander document zijn.

Deze definitie geeft misschien niet direct antwoord op wat PageRank nu is. Laten we eens kijken naar de specifieke uitleg achter deze PageRank definitie.

Een link als een stem

Google beschouwt een link van pagina A naar pagina B als een stem van pagina A voor pagina B. Hoe meer stemmen (links) een webpagina ontvangt, hoe belangrijker de pagina is voor Google en hoe hoger de PageRank van die webpagina.

Naast het aantal links naar een pagina weegt ook de ‘belangrijkheid’ mee van de pagina die de link geeft. De belangrijkheid van een link wordt uitgedrukt in diezelfde PageRank.

Niet alle links even belangrijk

Hoe hoger de PageRank van de pagina die de link geeft, hoe belangrijker deze ‘stem’ is voor de pagina die de link ontvangt.

Vergelijk het bijvoorbeeld met een aandeelhoudersvergadering. Een stem van een grote aandeelhouder weegt zwaarder dan een stem van een kleine aandeelhouder.

Zo weegt een link met een hoge PageRank dus ook zwaarder dan een link met een lage PageRank.

PageRank verlies je niet

Als een webpagina voor een andere pagina stemt middels een link, verliest de webpagina niet de eigen PageRank waarde. PageRank wordt dus niet overgeheveld van pagina naar pagina.

Een link van pagina naar pagina is simpelweg een stem die het gewicht meekrijgt van de PageRank van de verwijzende webpagina.

Laten we dit weer verduidelijken met het voorbeeld van de aandeelhouders. Een aandeelhouder stemt volgens het (gewicht van het) aantal aandelen, maar de aandelen zelf worden niet weggeven.

Door ongestructureerd te linken binnen je website, kun echter wel de PageRank waarde binnen je site niet optimaal verdelen. Hier ga ik binnenkort in een andere PageRank handleiding uitgebreid op in.

De echte PageRank

Google Toolbar PageRankVoor de buitenwereld is PageRank een getal op de schaal van 1 t/m 10, zichtbaar in o.a. de Google Toolbar (daardoor ook wel ‘Toolbar PageRank’ genoemd).

Update maart 2016
Google heeft de PageRank verwijderd uit de Google Toolbar. Er is dus geen manier meer om te achterhalen wat de (Toolbar) PageRank van een pagina is. Maar dat is sinds eind 2013 ook niet meer bijgewerkt.

Intern werkt Google echter met een ander getal voor PageRank, onbekend voor de buitenwereld, wat kan variëren van bijvoorbeeld 0,001 tot misschien wel 1 miljoen of meer.

Een leuk weetje: in juli 1996 had de webpagina met de hoogste PageRank een waarde van 11.589. (bron: het originele PageRank paper “The PageRank Citation Ranking: Bringing Order to the Web“)

Dit werkelijke PageRank getal wordt tegen een schaal afgezet – ook alleen bij Google bekend – die bepaalt in welke van de 10 PageRank schalen de webpagina valt, wat de zichtbare PageRank (of Toolbar PageRank) wordt die de buitenwereld tot begin 2016 zag.

PageRank schalen logaritmisch

De PageRank schaal is zeer waarschijnlijk logaritmisch opgebouwd, al weet niemand buiten Google dat zeker. Feit is dat het veel moeilijker is om van PageRank 5 naar 6 te gaan dan van PageRank 4 naar 5.

Wanneer het over PageRank gaat, betreft het dus eigenlijk een onbekend getal waarvan we alleen de grove schaal weten.

De PageRank formule

De PageRank van webpagina’s wordt berekend met behulp van een formule.

De originele PageRank formule – zoals door de Google oprichters beschreven in hun paper “The Anatomy of a Large-Scale Hypertextual Web Search Engine” – ziet er als volgt uit:

PR(A) = (1-d) + d(PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

Google PageRank formule

De PageRank formule ziet er op het eerste gezicht lastig uit, maar de werking wordt duidelijk als we de variabelen verklaren:

  • A = Webpagina waarvan de PageRank wordt berekend
  • d = De dempingsfactor, getal tussen 0 en 1 (standaard 0,85)
  • T1…Tn = De webpagina’s die naar pagina A linken
  • C = Het aantal uitgaande links op de webpagina

PageRank formule vereenvoudigd

Als we de PageRank formule vereenvoudigen en waar mogelijk invullen en beschrijven, krijgen we de volgende formule:

PageRank van webpagina A = 0,15 + 0,85 * (een deel van de PageRank van elke webpagina die naar pagina A linkt)

Het “deel” van de PageRank is gelijk aan de PageRank van de webpagina – die naar pagina A linkt – gedeeld door het aantal uitgaande links op deze webpagina.

Een webpagina ‘stemt’ dus een hoeveelheid PageRank aan elke andere pagina waar naartoe gelinkt wordt.

PageRank verdeling

De hoeveelheid PageRank die pagina te geven heeft, is iets lager dan de eigen PageRank van die pagina (standaard 0,85 * de eigen PageRank).

Deze te geven waarde wordt in de originele PageRank formule gelijk verdeeld over alle links waar die pagina naar verwijst.

In de originele publicatie van PageRank visualiseert Google de PageRank distributie als volgt:

PageRank distributie vereenvoudigd

Merk op dat het resultaat van de PageRank berekening een getal hoger dan 10 kan zijn, omdat dit de echte PageRank waarde betreft. Vervolgens wordt deze waarde tegen de genoemde 10-delige PageRank schaal afgezet.

Een PR4 link beter dan PR8?

Uit de originele PageRank formule zou je in theorie kunnen concluderen dat een link van een pagina met een (Toolbar) PageRank – ook afgekort tot PR – van 4 en 10 uitgaande links meer waard is dan een link van een PR8 pagina met 100 uitgaande links.

Maar deze conclusie is onjuist. We weten namelijk dat de PageRank zeer waarschijnlijk op een logaritmische schaal wordt uitgezet.

Dat betekent dat een link van een pagina met PageRank 8 en 100 uitgaande links toch meer PageRank waarde kan hebben dan een link van een PR4 pagina met 10 uitgaande links.

Welke schaal Google ook gebruikt, feit is dat elke link van pagina A naar pagina B de PageRank van pagina B verhoogt (met uitzondering van links die Google niet meetelt, zoals ik hieronder uitleg).

Herhaling PageRank berekening noodzakelijk

Wat niet duidelijk uit de PageRank formule blijkt, is dat het niet werkt als de PageRank berekening slechts 1 keer wordt uitgevoerd. Dit leg ik uit met een voorbeeld.

Stel dat we 2 webpagina’s hebben, A en B, die naar elkaar linken. Verder hebben ze geen inkomende links. Het volgende gebeurt er als de PageRank wordt berekenend:

  • 1. Bereken de PageRank van pagina A

Pagina A heeft nu een nieuwe PageRank waarde. De berekening is gedaan op basis van de inkomende link vanaf pagina B.

Maar pagina B heeft een inkomende link (vanaf pagina A) en de nieuwe PageRank waarde van pagina B is nog niet bepaald. De nieuwe PageRank waarde van pagina A is dus gebaseerd op onnauwkeurige data en is dus onnauwkeurig.

  • 2. Bereken de PageRank van pagina B

Pagina B heeft nu een nieuwe PageRank waarde. Maar deze waarde is onnauwkeurig, omdat het gebruikt maakt van de onnaukeurige PageRank waarde van pagina A.

PageRank iteraties

Door de PageRank berekening vele keren te herhalen, bereik je een accurate PageRank waarde.

Circa 50 iteraties zijn voldoende om een betrouwbare PageRank waarde te krijgen. Elke volgende herhaling levert geen verandering van betekenis op.

Google PageRank update

Google PageRank updateGoogle werkte de Toolbar PageRank gemiddeld 3 tot 4 keer per jaar bij.

Dat wil zeggen dat je op die momenten een actueel beeld had van de PageRank-schaal waar je op dat moment in viel.

De benodigde herhalingen (iteraties) van de PageRank berekening was waarschijnlijk de reden waarom er altijd enkele maanden tussen elke PageRank update zaten.

Aangezien PageRank opnieuw wordt uitgerekend voor de gehele Google index (!) en vele iteraties nodig heeft, duurt het lang voordat de PageRank is bijgewerkt.

Sinds eind 2013 is de Toolbar PageRank niet meer bijgewerkt en sinds maart 2016 niet meer te zien in de Google Toolbar.

Actuele PageRank

Ik verwacht dat Google inmiddels voldoende rekenkracht heeft om PageRank vaker dan elke 3 tot 4 maanden bij te werken. Google heeft ook bevestigd dat ze intern nog met PageRank werken.

Google wilde dat mensen zich geen zorgen meer maken om PageRank en zich richten op andere zaken, zoals kwalitatieve en unieke content.

Daarom zijn ze gestopt met het bijwerken en tonen van de PageRank score.

PageRank berekening volledig opnieuw

Google PageRankBij het berekenen van de PageRank van een webpagina wordt de huidige PageRank volledig genegeerd.

Elke PageRank berekening is een verse berekening op basis van de ‘stemmen’ die de inkomende links op dat moment geven.

PageRank berekening voor hele web

Aangezien het internet zeer hard groeit, is het web bij elke nieuwe PageRank berekening weer een stuk groter geworden.

Google berekent de PageRank over het totale web (!). Dat betekent dat de grenzen van de 10 PageRank schalen ook opschuiven bij elke PageRank update.

Meer links, lagere PageRank?

Het kan dus bijvoorbeeld voorkomen dat je website na een PageRank update in een andere schaal valt. De PageRank van je website daalt dan, terwijl je misschien wel meer links hebt ontvangen.

Besef je nogmaals goed dat dit niet de werkelijke PageRank is waar Google mee rekent. Wij zien slechts in welke van de 10 grove schalen van de Toolbar PageRank een webpagina valt.

Hoe meer links, hoe meer PageRank

De PageRank formule toont ook aan dat hoe meer inkomende links een webpagina heeft, hoe hoger de PageRank is.

In de beginjaren van Google werd hier misbruik van gemaakt door mensen die complete linknetwerken opgezet hadden met het doel om de PageRank te verhogen.

Inmiddels herkent Google dergelijke onnatuurlijke links, die enkel en alleen bedoeld zijn om PageRank – en daarmee de posities in de zoekresultaten – te verhogen. Dergelijke links kunnen zelfs leiden tot negatieve effecten op je posities in de zoekresultaten.

Hieronder beschrijf ik uitgebreid hoe het Google PageRank algoritme waarschijnlijk is aangepast en verbeterd.

Niet alle links tellen mee

PageRank telt dus in feite de links naar webpagina’s, maar niet alle links tellen mee.

Zo worden links van bijvoorbeeld de zojuist beschreven linknetwerken vrijwel volledig uit de PageRank berekening gefilterd.

De belangrijkste factor voor het toekennen van PageRank is echter dat de link op een pagina staat die Google heeft opgeslagen in haar index (zie voor meer informatie de Handleiding: Hoe werkt een zoekmachine?).

Het is eenvoudig, maar niet minder belangrijk: als Google de link niet kent, kan er ook geen PageRank aan toegekend worden.

Link in index, toch onzichtbaar

Dat een link op een pagina staat die Google in haar index heeft, betekent niet altijd dat Google de link ook ‘ziet’ en meetelt in de PageRank berekeningen.

Zo zijn er enkele technieken om websites te bouwen, zoals JavaScript of Flash, waar Google niet of nauwelijks mee overweg kan.

Zoekmachine-onvriendelijke technieken

Google leert steeds beter overweg gaan met dergelijke technieken. Zo kunnen links in Flash bestanden steeds beter gevolgd worden en kan Google links in sommige implementaties van JavaScript steeds beter volgen.

Maar dergelijke links zijn nog steeds meestal niet zichtbaar voor Google en tellen in dat geval niet mee in de PageRank berekening.

Ook al zou Google op een gegeven moment alle links in bijvoorbeeld Flash of JavaScript kunnen volgen en indexeren, betekent dit niet dat de PageRank optimaal wordt verdeeld en dat de website of pagina optimaal vindbaar is.

Lees hiervoor ook de handleiding “Zoekmachine-optimalisatie (SEO) voor Flash websites“.

Links ‘onzichtbaar’ maken

NofollowDoor het gebruik van technieken zoals JavaScript, maak je een link dus in feite ‘onzichtbaar’ voor Google. Maar dit kun je ook bewust doen.

Zo kun je een link voorzien van een attribuut, het door Google geïntroduceerde “nofollow” attribuut, waarmee je de link onzichtbaar maakt voor Google (en andere zoekmachines).

Google zal de link dan niet meewegen in de PageRank berekening.

“Dangling links”

Voor webpagina’s die geen uitgaande links naar andere pagina’s hebben, is het niet duidelijk waar hun PageRank waarde naartoe gestuurd moet worden. Google noemt de links naar deze webpagina’s “dangling links”.

Aangezien “dangling links” geen invloed uitoefenen op de PageRank van andere webpagina’s, worden deze links uit de PageRank berekening verwijderd. Dangling links tellen dus ook niet mee.

Nadat alle PageRank berekeningen zijn gedaan, worden de dangling links weer toegevoegd, zonder dat ze veel veranderingen veroorzaken.

PageRank formule achterhaald?

Het is waarschijnlijk dat de originele PageRank formule inmiddels is aangepast, of eigenlijk verbeterd, door Google.

In de originele PageRank formule wordt de PageRank van een webpagina dus gelijk verdeeld over alle uitgaande links ( …PR(T1)/C(T1)… ). Het is echter zeer waarschijnlijk dat dit niet meer het geval is.

Dempingsfactor PageRank

Google varieert waarschijnlijk met de dempingsfactor, die standaard 0,85 is.

Dat betekent dat webpagina A standaard 85% krijgt van een “deel” van de PageRank van elke webpagina die naar pagina A linkt, zoals we eerder zagen vanuit de PageRank formule.

Uit de originele PageRank formule blijkt: hoe lager de dempingsfactor, hoe lager de PageRank die een webpagina ontvangt van de naar die pagina verwijzende links.

Demping per pagina of link

Dit betekent dat Google bepaalde webpagina’s kan beperken in het ontvangen van PageRank door de dempingsfactor te verlagen.

Misschien is het Google PageRank algoritme nog verder ontwikkeld en kan Google niet alleen webpagina’s maar ook individuele links beperken in het ontvangen van PageRank.

Bepaalde links minder waard

Zo is het vrijwel zeker dat links in bijvoorbeeld de ‘footer’ onderin een website of een ‘sidebar’ aan de zijkant van een website minder PageRank toebedeeld krijgen (en dus doorgeven) dan een link in de tekstuele content van een individuele webpagina.

Een footer of sidebar is meestal een vast onderdeel van een website, die op iedere pagina dezelfde links bevat. Google herkent dit en ziet dat deze links niet relevant zijn voor de meeste individuele webpagina’s, waardoor deze links minder PageRank doorgeven.

Bevestiging Google

In mei 2010 heeft Google een in 2004 aangevraagd patent toegewezen gekregen, waarin staat beschreven hoe Google individuele links op een pagina een verschillende waarde toekent (bron).

Dit is het bewijs dat Google al lang bezig is met het verfijnen van de originele PageRank formule. Het is uiteindelijk ook niet meer dan logisch, omdat een mens ook niet evenveel waarde toekent aan alle links op een webpagina.

Ook Google engineer Matt Cutts gaf medio 2009 in deze video aan dat Google zich het recht toe-eigent om links in bijvoorbeeld de footer en sidebar anders te waarderen dan links in de content van een webpagina.

Daarnaast zou het bijvoorbeeld zo kunnen zijn dat uitgaande links van een webpagina naar pagina’s binnen dezelfde website minder PageRank doorgeven dan uitgaande links naar webpagina’s buiten dezelfde website.

Deze individuele PageRank waarderingen per pagina of link zou Google bijvoorbeeld kunnen bereiken middels het variëren met de dempingsfactor.

Hilltop algoritme

Veel mensen denken dat Google het Hilltop algoritme (originele publicatie) heeft toegevoegd aan PageRank.

Eén van de bedenker van Hilltop, Krishna Bharat, is later voor Google gaan werken (en heeft o.a. Google Nieuws bedacht).

Hoe werkt Hilltop?

Het belangrijkste verschil met PageRank is dat Hilltop de relevantie van webpagina’s ook meeweegt, alleen op basis van “expert” bronnen.

Het Hilltop algoritme probeert per onderwerp/zoekopdracht de autoriteiten te vinden, die als expert bron worden aangewezen.

Niet de expert bronnen zelf, maar de webpagina’s waarnaar deze expert bronnen verwijzen, worden vervolgens als zoekresultaten teruggegeven.

Hilltop rangschikking

De rangschikking van deze zoekresultaten vindt plaats op basis van het aantal en de relevantie van expert bronnen die niet met elkaar te maken hebben (andere auteurs, IP-adressen, etc.).

Ook kijkt Hilltop naar een overeenkomst tussen de zoekopdracht en de link, bijvoorbeeld in de linktekst of URL.

Het Hilltop algoritme is ontwikkeld voor generieke zoektermen en is bedoeld als aanvulling op bestaande algoritmes van zoekmachines. Als Hilltop geen expert bronnen vindt, worden er namelijk geen zoekresultaten gegeven.

Het is in ieder geval aannemelijk dat het PageRank algoritme verder is ontwikkeld, maar of dit middels het Hilltop algoritme is geweest, is onduidelijk.

PageRank misverstanden

Google PageRankPageRank was in de beginjaren de kern van Google’s zoekmachine. PageRank is mede daarom zeer populair en veelbesproken. Maar is dat nu nog terecht?

PageRank is niet totale algoritme Google

Een groot misverstand is dat PageRank het totale algoritme van Google vormt (het algoritme bepaalt hoe webpagina’s worden gerangschikt in de zoekresultaten).

Een grove vuistregel was altijd: hoe hoger de PageRank, hoe belangrijker de webpagina is voor Google.

Maar dat is al lang niet meer het geval. PageRank is slechts één van de meer dan naar schatting 200 factoren die Google tegenwoordig hanteert om webpagina’s te rangschikken in haar zoekresultaten.

Relevantie? PageRank kijkt er niet naar!

Een 2e groot misverstand is dat PageRank ook iets zegt over de relevantie van een webpagina. Dat is namelijk niet zo.

De relevantie van een webpagina wordt bepaald door de context van die pagina. Natuurlijk zijn de links naar die pagina een belangrijk signaal voor relevantie, maar in z’n originele vorm telt PageRank alleen maar het aantal links en het gewicht ervan.

Tekstherkenningstechnieken

PageRank weegt niet mee of de websites die naar een pagina linken relevant zijn voor de betreffende webpagina. Dit geeft Google ook aan in hun definitie van PageRank: “Daarom combineert Google PageRank met hoogwaardige tekstherkenningstechnieken…???.

Ook in de originele Google PageRank publicatie vinden we een zeer duidelijke uitspraak: “PageRank is a global ranking of all web pages, regardless of their content, based solely on their location in the Web’s graph structure”.

Voorbeeld: zelfde PageRank, andere waarde

Het maakt namelijk verschil van welke websites je links ontvangt. Bijvoorbeeld een link naar je site op een site in dezelfde branche met een (Toolbar) PageRank van 6 heeft wel degelijk meer waarde dan een link op een site buiten je branche met dezelfde PageRank.

Hieruit kunnen we concluderen dat PageRank niet naar relevantie kijkt, maar dat Google daar bijvoorbeeld tekstherkenningstechnieken voor gebruikt.

PageRank zegt in feite alleen iets over de ‘belangrijkheid’ van een webpagina. Dit betekent dus dat de relevantie wordt bepaald door andere factoren dan de PageRank.

Anchor tekst of linktekst

PageRank kijkt dus bijvoorbeeld niet naar de tekst waarmee naar een pagina wordt gelinkt, de “anchor tekst”. Terwijl de linktekst toch een belangrijke factor is waarop Google de zoekresultaten rangschikt.

William Chang heeft mij ook persoonlijk bevestigd dat PageRank niet naar de linktekst kijkt. En van deze man, de chief scientist bij zoekmachine Baidu, die de Google oprichters ook persoonlijk kent, neem ik dat wel aan! 😉

Google PageRank: waardevol of negeren?

PageRank bestaat al sids 1996, maar lijkt onverminderd populair. Is Google’s PageRank nog steeds waardevol of kun je het negeren?

Het korte antwoord is: PageRank alleen zegt niets over de relevantie of de vindbaarheid van je website of een specifieke webpagina.

We hebben gezien dat PageRank zeer waarschijnlijk verder is ontwikkeld en verbeterd, maar in de basis analyseert het PageRank algoritme alleen het aantal links tussen webpagina’s.

Ook hebben we gezien dat PageRank minder waarde heeft gekregen en slechts 1 van de naar schatting 200 factoren is waar Google naar kijkt.

Daarnaast kan het zelfs voorkomen dat alles stijgt – het aantal inkomende links, hogere posites in zoekmachines en meer bezoekers – en alsnog kan je PageRank waarde dalen.

Dat geeft eigenlijk al aan dat de waarde van PageRank tegenwoordig beperkt is.

Focus op bezoekers!

Ik adviseer je dus om je niet druk te maken om de Google PageRank waarde. Focus op een website die content biedt die waarde toevoegt voor je bezoekers.

En meet of die bezoekers een voor jou gewenste actie uitvoeren op je website. Beoordeel daarop het succes van je website en alle inspanningen die je ervoor doet.

Google PageRank toepassen op SEO

Wil je nog meer weten over PageRank of wil je PageRank optimaal toepassen op SEO?

Op dit moment ontwikkel ik een 2e Google PageRank handleiding, waar ik SEO feiten concludeer uit PageRank berekeningen.

Deze PageRank handleiding vind je binnenkort bij de andere zoekmachinemarketing handleidingen!

Achtergrond & meer informatie

The Anatomy of a Large-Scale Hypertextual Web Search Engine (Stanford.edu)
The PageRank Citation Ranking: Bringing Order to the Web (Stanford.edu)
Hilltop: A Search Engine based on Expert Documents (Toronto.edu)
Hoe werkt Pagerank nou eigenlijk (Netters.nl)
De PageRank mythe (Dutchcowboys.nl)