noindex nofollowDe Google oprichters Larry Page (triviant vraag: waar komt de naam PageRank vandaan? 😉 ) en Sergei Brin stellen in hun originele paper:

“Een webpagina moet in de index van Google zijn opgenomen om PageRank te verzamelen en door te kunnen geven.”

Indexatie nodig voor PageRank?

Ik vroeg me af of dit vandaag de dag echter nog zo is.

In eerste instantie lijkt het logisch dat een webpagina in Google’s index moet staan om PageRank te verzamelen en door te geven aan andere pagina’s.

Google berekent namelijk de PageRank over het totale netwerk aan websites die Google heeft geïndexeerd.

Dit betekent dat een niet-geïndexeerde pagina geen PageRank kan vergaren.

Of toch wel?

Update juli 2009: Google’s Matt Cutts heeft een video online geplaatst waar hij de centrale vraag in dit artikel beantwoordt: “Als een pagina is uitgesloten met Robots.txt, geeft een link naar die pagina dan PageRank door?”

Robots.txt en Meta robots

Maar hoe zit het dan met het gebruik van het Robots.txt bestand waarmee je pagina’s uitsluit van indexatie?

En de Meta robots tag die je kunt configureren zodat pagina’s niet geïndexeerd worden, maar waarbij wel alle links gevolgd worden (noindex,follow)?

Het leek me leuk om m’n netwerk hierover te raadplegen. Ik gooide de vraag in Twitter en één van de mensen die reageerde was Wiep Knol, linkbuilding expert:

SEO%20question%20 %20Wiep Geeft een niet geïndexeerde pagina PageRank door?

Daarnaast heb ik de vraag ook gesteld in de LinkedIn SEO groep.

Allereerst reageerde diverse mensen ook zoals hierboven (niet in de index? geen PageRank). Maar Marie-Claire Jenkins gaf een heldere en verklarende reactie:

Marie Claire Jenkins - Geeft een niet geïndexeerde pagina PageRank door?

De kern van haar reactie beschrijft goed het nuance verschil van indexeren en links volgen:

“NoIndex is a request to not show the page in the results. PR still passes. NoFollow, PR doesn’t pass but does accumulate???

Niet geïndexeerd? Toch PageRank!

Als we Wiep en Marie-Claire moeten geloven, dan wordt onze vraag “Geeft een niet-geïndexeerde pagina PageRank door???? beantwoord met “Ja???.

En ik denk dat ze gelijk hebben.

Een webpagina kan om meerdere redenen niet in de index van een zoekmachine staan. Maar men kan nog steeds naar een pagina linken.

En daarom kan een niet-geïndexeerde pagina PageRank ontvangen.

Is de link bekend bij Google?

Natuurlijk moet de link op de webpagina – die de link plaatst naar de niet-geïndexeerde pagina – wel in Google’s index voorkomen, zodat Google op de niet-geïndexeerde pagina terechtkomt.

Laten we aannemen dat een pagina is geblokkeerd van indexatie middels Robots.txt.

Dat betekent dat deze pagina niet in de zoekresultaten veschijnt, maar Google kent wel degelijk de links van en naar deze webpagina.

Hierdoor kan Google de pagina meenemen in de PageRank berekeningen en kan de pagina dus PageRank vezamelen en doorgeven.

(Her)definitie van ‘niet-geïndexeerd’

Hieruit blijkt dat we eigenlijk de definitie van niet-geïndexeerd moeten aanscherpen. Mijn aanzet hiervoor is dit:

“Een pagina heeft een voor Google zichtbare inkomende link nodig om PageRank te vergaren en door te kunnen geven.???

In deze definitie betekent het deel “voor Google zichtbare inkomende link??? dat de link geen nofollow bevat of op een andere manier onzichtbaar is voor Google.

Samenvattend: geeft een niet-geïndexeerde pagina PageRank door?

Ja!

(als de inkomende links zichtbaar en volgbaar zijn voor Google 😉 )

Zie ook de discussie hierover op m’n Engelstalige blog