Geeft een niet geïndexeerde pagina PageRank door?

noindex nofollowDe Google oprichters Larry Page (triviant vraag: waar komt de naam PageRank vandaan? ;-) ) en Sergei Brin stellen in hun originele paper:

“Een webpagina moet in de index van Google zijn opgenomen om PageRank te verzamelen en door te kunnen geven.”

Indexatie nodig voor PageRank?

Ik vroeg me af of dit vandaag de dag echter nog zo is.

In eerste instantie lijkt het logisch dat een webpagina in Google’s index moet staan om PageRank te verzamelen en door te geven aan andere pagina’s.

Google berekent namelijk de PageRank over het totale netwerk aan websites die Google heeft geïndexeerd.

Dit betekent dat een niet-geïndexeerde pagina geen PageRank kan vergaren.

Of toch wel?

Update juli 2009: Google’s Matt Cutts heeft een video online geplaatst waar hij de centrale vraag in dit artikel beantwoordt: “Als een pagina is uitgesloten met Robots.txt, geeft een link naar die pagina dan PageRank door?”

Robots.txt en Meta robots

Maar hoe zit het dan met het gebruik van het Robots.txt bestand waarmee je pagina’s uitsluit van indexatie?

En de Meta robots tag die je kunt configureren zodat pagina’s niet geïndexeerd worden, maar waarbij wel alle links gevolgd worden (noindex,follow)?

Het leek me leuk om m’n netwerk hierover te raadplegen. Ik gooide de vraag in Twitter en één van de mensen die reageerde was Wiep Knol, linkbuilding expert:

SEO%20question%20 %20Wiep Geeft een niet geïndexeerde pagina PageRank door?

Daarnaast heb ik de vraag ook gesteld in de LinkedIn SEO groep.

Allereerst reageerde diverse mensen ook zoals hierboven (niet in de index? geen PageRank). Maar Marie-Claire Jenkins gaf een heldere en verklarende reactie:

Marie Claire Jenkins - Geeft een niet geïndexeerde pagina PageRank door?

De kern van haar reactie beschrijft goed het nuance verschil van indexeren en links volgen:

“NoIndex is a request to not show the page in the results. PR still passes. NoFollow, PR doesn’t pass but does accumulate”

Niet geïndexeerd? Toch PageRank!

Als we Wiep en Marie-Claire moeten geloven, dan wordt onze vraag “Geeft een niet-geïndexeerde pagina PageRank door?” beantwoord met “Ja”.

En ik denk dat ze gelijk hebben.

Een webpagina kan om meerdere redenen niet in de index van een zoekmachine staan. Maar men kan nog steeds naar een pagina linken.

En daarom kan een niet-geïndexeerde pagina PageRank ontvangen.

Is de link bekend bij Google?

Natuurlijk moet de link op de webpagina – die de link plaatst naar de niet-geïndexeerde pagina – wel in Google’s index voorkomen, zodat Google op de niet-geïndexeerde pagina terechtkomt.

Laten we aannemen dat een pagina is geblokkeerd van indexatie middels Robots.txt.

Dat betekent dat deze pagina niet in de zoekresultaten veschijnt, maar Google kent wel degelijk de links van en naar deze webpagina.

Hierdoor kan Google de pagina meenemen in de PageRank berekeningen en kan de pagina dus PageRank vezamelen en doorgeven.

(Her)definitie van ‘niet-geïndexeerd’

Hieruit blijkt dat we eigenlijk de definitie van niet-geïndexeerd moeten aanscherpen. Mijn aanzet hiervoor is dit:

“Een pagina heeft een voor Google zichtbare inkomende link nodig om PageRank te vergaren en door te kunnen geven.”

In deze definitie betekent het deel “voor Google zichtbare inkomende link” dat de link geen nofollow bevat of op een andere manier onzichtbaar is voor Google.

Samenvattend: geeft een niet-geïndexeerde pagina PageRank door?

Ja!

(als de inkomende links zichtbaar en volgbaar zijn voor Google ;-) )

Zie ook de discussie hierover op m’n Engelstalige blog

Interessant? Lees dan deze gerelateerde artikelen die ik eerder schreef:

  1. Google PageRank handleiding geschreven
  2. Google: “301 redirect verliest geen (extra) PageRank”
  3. Google devalueert nofollow, indexeert JavaScript links. Gevolgen PageRank sculpting en Paid Links?
  4. Case: Robots.txt uitsluiting, toch in index zoekmachines
  5. Zoekmachine (robot) instructies en hun SEO effect

6 Reacties op "Geeft een niet geïndexeerde pagina PageRank door?"

  1. webdesign etten leur op 04 December, 2008

    Google heeft toch meerdere indexen? :)

  2. Multus op 06 December, 2008

    Lijkt me niet nee.

  3. Eduard Blacquière op 07 December, 2008

    @webdesign
    Het gaat niet om meerdere indexen, maar het verschil tussen indexatie en crawling

    @Multus
    Het is toch echt zo :)

    Lees zeker de discussies op m’n Engelstalige blog en op Netters:

    http://eduardblacquiere.com/non-indexed-page-pass-pagerank/
    http://netters.nl/niet-geindexeerd-pagerank

  4. Tom Broekhoven op 08 December, 2008

    Interessante discussie. Ik meen me te herinneren dat ze bij SEOmoz meerdere keren test hebben uitgevoerd om te achterhalen of er op deze manier pagerank wordt doorgegeven.

    Het lijkt mij echter van wel want op een no-index pagina zit nog niet automatisch een no-follow. Het lijkt mij dat een crawler naar de links kijkt zelfs al zit er een noindex op de pagina. Ik kan het natuurlijk ook fout hebben, maar verwacht wel dat er een stukje pagerank wordt meegegeven. De vraag is dan ook nog of er op dat moment ook nog een waardevermindering in het spel is :)

  5. Eduard Blacquière op 08 December, 2008

    @Tom
    Zoals ook blijkt uit de posts op EduardBlacquiere.com en Netters.nl, geeft een niet-geïndexeerde pagina wel degelijk PageRank door.

    Een interessantere vraag is of een niet-geïndexeerde pagina minder PageRank doorgeeft dan een pagina die wel is geïndexeerd…

  6. Isinet internet marketing op 05 May, 2009

    @ webdesign

    Google heeft wel degelijk meer dan 1 index. De zogenaamde ’supplementaire index’ van Google bevat de websites met (soms op het eerste zicth) slechte kwaliteit. Er is echter geen zekerheid dat sites die in de supplementaire index belanden, niet meer terug in de hoofdindex komen. Op voorwaarde dat aan de kwaliteit wordt gesleuteld weliswaar.

    Zo beheren we een infosite waar dit fenomeen heel duidelijk zichtbaar is. Over het algemeen komen een 1.500 bezoekers naar de site, in golfbewegingen met een vrij vast tijdsinterval komen er 10.000 bezoekers op de site.

Reageer