Maandag 27 mei 2024 is een markante dag geworden in de SEO-wereld.
De dag van de “Google Leak”.
De dag dat alle Google ranking factoren op straat kwamen te liggen. En ze liggen er nog steeds.
Rand Fishkin, bekend van o.a. het oprichten van (SEO)Moz en SparkToro, bracht naar buiten dat er 14.014 zogeheten “attributes” in 2.596 documenten of “modules” openbaar toegankelijk zijn (nadat hij hierover getipt was).
Rand deelde dit vooraf met SEO-specialist Mike King, die er op dezelfde dag een uitgebreid artikel over publiceerde. Overigens had Dan Petrovic dit lek ook al eerder gevonden.
In de weken erna is er veel over geschreven en zijn er tools ontwikkeld om door deze goudmijn te zoeken. Aleyda Solis heeft bijvoorbeeld een aantal artikelen en tools verzameld in deze sheet.
Google heeft inmiddels bevestigd dat het daadwerkelijk Google documentatie is.
Waarom deze 14k attributen betrouwbaar zijn
Ik denk dat we absoluut waarde kunnen hechten aan alle ruim 14k attributen.
Allereerst staan er heel veel attributen in waarvan we door Google zelf (bijv. vanuit hun documentatie) zeker weten dat ze gebruikt worden.
Denk alleen al aan allerlei SEO basiselementen, zoals:
- isRoboted – Is disallowed for crawling according to host’s robots.txt.
- seenNoindex – Has noindex meta robots flag
- isErrorPage – Indicates if the page serves error to smartphone crawler. go/ramsey-sp404demotion
- isN1Redirect – Indicates if the page has mobile N-1 redirection. go/ramsey-n1demotion
- canonicalUrl – Canonical url of the retrieved_url, if one was resolved during retrieval, for example, if a rel=”canonical” link tag was provided in the retrieved web page.
- rawPagerank – Raw pagerank of the url
- isSmartphoneOptimized – Indicates if the page is rendered in a friendly manner on smartphones
- indexingMobileSpeedPageSpeedFieldData
- freshnessEncodedSignals – Stores freshness and aging related data, such as time-related quality metrics predicted from url-pattern level signals.
- languageTag – This returns the most probable language for the document.
- titlematchScore – Titlematch score of the site, a signal that tells how well titles are matching user queries
- siteDisplayName – The domain-level display name of the website, such as “Google”
Daarnaast staan er veel attributen in die direct te koppelen zijn aan door Google bekend gemaakte algoritmes/systemen, zoals de oudere Panda & Penguin updates of het nieuwere (Product) Reviews systeem:
- pandaDemotion – This is the encoding of Panda fields in the proto SiteQualityFeatures in quality/q2/proto/site_quality_features.proto
- babyPandaV2Demotion – New BabyPanda demotion, applied on top of Panda. This is meant to replace |baby_panda_demotion|.
- productReviewPDemoteSite – Product review demotion/promotion confidences. (Times 1000 and floored)
- penguinLastUpdate – BEGIN: Penguin related fields. Timestamp when penguin scores were last updated. Measured in days since Jan. 1st 1995.
- penguinPenalty – Page-level penguin penalty (0 = good, 1 = bad)
- exactMatchDomainDemotion
En verder vinden we tussen alle modules en attributen ook namen van systemen die genoemd worden in de getuigenverklaring met Google’s Pandu Nayak, waaronder:
- Navboost
- Glue (of SuperGlue)
- RankEmbed
- BERT
- Tangram (voorheen Tetris)
Kortom, in deze lijst met ruim 14k attributen schuilt wat mij betreft heel veel waardevolle informatie over hoe Google werkt.
Ingrediënten, maar niet het recept
Het Google algoritme was – en is nog steeds – een heel goed en zorgvuldig bewaard geheim.
Daarom is het zo uniek dat nu in ieder geval de mogelijke “ingrediënten” van de Google zoekmachine bekend zijn.
Alleen weten we nog steeds niet het “recept”: we weten niet of de ingrediënten nog gebruikt worden, hoe zwaar elke factor weegt, hoe de modules precies (samen)werken, etc.
Misschien dat Google na dit lek zelfs allerlei factoren minder belangrijk (= minder manipuleerbaar) heeft gemaakt, wie zal het zeggen.
Goudmijn: kijkje in de keuken
Dus natuurlijk moet ik een disclaimer maken dat ik hieronder mogelijk conclusies trek die niet helemaal zeker of te bevestigen zijn.
Maar het is het grootste kijkje in de keuken die we tot nu toe gekregen hebben sinds de oprichting van Google 25 jaar geleden!
Het is in ieder geval een lijst met ranking factoren en eigenschappen/attributen van pagina’s en sites die op z’n minst een keer serieus overwogen zijn en waarvan er waarschijnlijk veel ook gebruikt zijn en nog steeds gebruikt worden.
Een goudmijn dus wat mij betreft.
- Een goudmijn om uitspraken en stellingen van Google te bevestigen of ontkrachten (Google: “Nee hoor, we gebruiken CTR e.d. niet in rankings” 🤥 )
- Een goudmijn om SEO best practices en tactieken mee te bevestigen of ontkrachten (dat probeer ik in deze blog te doen)
- Een goudmijn aan testideeën (leestip: dit artikel met een testmethode of dit webinar met Will Critchlow & Mike King)
20 onderbouwde SEO tactieken
We zijn nog maar zo’n 2 maanden verder na de leak en ik heb het gevoel dat er nog meer waardevols in te vinden is.
Dit is dus slechts een eerste lijst met tactieken, die ik zo snel kan koppelen aan attributen en/of modules uit de Google API leak.
Ik heb de lijst met SEO tactieken gegroepeerd onder de volgende 5 thema’s:
A. Kwaliteit
B. E-E-A-T
C. Topical autoriteit
D. User signals
E. Linkbuilding
Dit is de lijst, onderverdeeld in deze groepen
A. Kwaliteit van je pagina & content is alles
1. Zorg voor een hoge kwaliteit van ALLE pagina’s op je site!
2. Wees voorzichtig met door AI gegenereerde content
3. Maak originele, eigen content
4. Afbeelding in de main content? Zorg dat deze relevant en helpful is
5. Houd Google niet voor de gek
B. Laat E-E-A-T zien, zeker voor YMYL content
6. Laat E-E-A-T zien, zeker voor YMYL content
7. Bouw aan autoriteit op site- en paginaniveau
8. Zorg voor een positief sentiment rondom je merknaam
9. Laat zien welke mensen (auteurs, experts) betrokken zijn bij de totstandkoming van content
10. Laat zien dat de auteurs/experts waar je mee werkt aantoonbaar expertise hebben & bouw dit uit
11. E-E-A-T mist wat mij betreft nóg een ‘E’, namelijk: Effort. Stop veel effort in het maken van satisfying, helpful content
C. Bouw aan je Topical autoriteit
12. Zorg voor een duidelijk “topic profiel” en houd daar focus op
13. Zorg dat er niet te veel pagina’s zijn die NIET over je main topic gaan
14. Gebruik termen in je teksten die dichtbij het hoofdonderwerp liggen
15. Zorg dat uitgaande links (naar andere sites) ook relevant zijn voor het onderwerp
D. Zorg voor positieve User signals
16. Zorg d.m.v. klantonderzoek, UX & design voor helpful, satisfying content, zodat gebruikers/bezoekers hun doelen snel & eenvoudig behalen
E. Blijf weg van spammy linkbuilding
17. Zorg voor links vanaf pagina’s die zelf van goede kwaliteit zijn
18. Blijf uit de buurt van spammy links
19. Zorg dat de context van de link (woorden, zinnen, tekst, e.d.) ook relevant is voor de doelpagina
20. Vermijd meerdere links naar je site vanuit hetzelfde artikel, zeker voor ingekochte links
Hieronder heb ik voor elk van de 20 SEO tactieken een aantal voorbeelden van attributen uit de Google Leak toegevoegd, aangevuld met een korte toelichting.
A. Kwaliteit
De eerste groep met SEO-tactieken gaat over de kwaliteit van je pagina’s / content. Ondanks dat het een breed en niet concreet begrip is, hebben we inmiddels veel informatie van Google om dit concreet te maken. En, nog belangrijker, weten we de pagina kwaliteit een cruciale rol speelt in ALLE Google processen, grofweg te verdelen in crawling, indexing en ranking.
1. Zorg voor een hoge kwaliteit van ALLE pagina’s op de site!
- siteQualityStddev – Estimate of site’s PQ rating stddev–spread of the page-level PQ ratings of a site
- pqData – Encoded page-level PQ signals.
- golden – Flag for indicating that the document is a gold-standard document. This can be used for putting additional weight on human-labeled documents in contrast to automatically labeled annotations.
- lowQuality – S2V low quality score: converted from quality_nsr.NsrData, applied in Qstar
- GibberishScore – The gibberish score is represented in 7 bits, going from 0 to 127.
Naast dat elke individuele pagina van hoge kwaliteit moet zijn, geldt dat ook voor ALLE pagina’s op je hele site.
Dat is precies in lijn met wat Google al lang zegt bij Core algoritme updates en Helpful Content updates. Daar willen ze ook significante verbeteringen zien over de hele site heen om een serieuze herwaardering te geven.
Met siteQualityStddev meet Google hoe ver de individuele pagina kwaliteit (PQ) scores van alle pagina’s op een site uit elkaar liggen.
We gaan hiervoor terug naar onze wiskunde lessen met de standaarddeviatie 🤓 Een lage deviatie/spread is waar je naar moet streven, want dan ligt de kwaliteit van alle pagina’s op je site dicht bij elkaar.
Ook heel interessant is de rest van de attributen die binnen dezelfde Quality module vallen.
Interessant is bijvoorbeeld ook de golden standaard voor pagina’s, die gebaseerd lijkt te zijn op ratings van de search quality raters.
Nog een reden om deze guidelines vaker naast je pagina’s te leggen en daar zo hoog mogelijke scores na te streven (bijv. met hulp van deze cheatsheet).
Attributen als lowQuality en GibberishScore laten weinig te raden over en spreken voor zich 💩
2. Wees terughoudend met door AI gegenereerde content
racterScores – Site-level AGC classification score (see also go/project-racter-overview)
Een actueel thema is natuurlijk de inzet van AI om teksten en andere content te genereren. In dezelfde interessante module waar siteQualityStddev onderdeel van is, staat ook het attribuut racterScores.
Hiermee geeft Google een site-level “AGC” score. Mogelijk staat dit voor Artificially Generated Content, aldus de inschatting van deze SEO-specialist.
Hij refereert aan project Racter, een soort voorloper van ChatGPT uit de jaren 80. Dit is natuurlijk speculeren, maar lijkt me aannemelijk.
Of misschien staat AGC wel voor Automatically Generated Content.
Je wilt in ieder geval niet dat Google je site classificeert als sterk in Artificially Generated Content. Dus wees zeker in deze tijd met de aanwezigheid van AI tools heel voorzichtig met het te zwaar leunen op alleen door AI gegenereerde teksten en andere content.
Want dat levert meestal heel middelmatige content op. In ieder geval weinig originele en geen eigen content.
3. Maak originele, eigen content
- copycatScore
- OriginalContentScore – The original content score is represented as a 7-bits, going from 0 to 127. Only pages with little content have this field.
Ook deze attributen laten weinig te raden over (die ik gevonden heb in een module over blogposts).
Het niet kopiëren van andere content en zelf originele content maken is natuurlijk logisch om te doen, maar we weten allemaal dat het hele internet vol staat met niet originele en niet eigen gemaakte content.
En Google weet + meet dat natuurlijk ook met weinig verbloemende attributen als copycatScore.
4. Afbeelding in de main content? Zorg dat deze relevant en helpful is
salience – Salient score, indicating how important an image is to the page it’s on.
Het begrip salience komt vaker voor in de Google Leak en in het algemeen in machine learning en AI (zie deze uitleg)
In dit geval gaat salience (onderdeel van deze image module) om hoe belangrijk een afbeelding is ten opzichte van de pagina waar deze afbeelding op staat.
Kortom, is de afbeelding een cruciaal en helpful onderdeel van de main content of niet?
Een voorbeeld: Stock foto’s zijn dat meestal niet 😉
5. Houd Google niet voor de gek
- lastSignificantUpdate – Contains a date used for the “Date Last Modified” toolbelt restrict mode
- unsquashedClicks – This is not being populated for the current format – instead two instances of CrapsClickSignals (squashed/unsquashed) are used. We are migrating to the new format where this field will be populated.
- trustedMatching – Number of trusted anchors with anchor text matching spam terms.
Natuurlijk is en blijft SEO een kat en muis spel. Er zijn altijd trucjes en technieken die toch nog altijd kunnen werken of invloed kunnen hebben, ook al is het tegen Google’s richtlijnen of uitspraken.
Maar de trucjes en misleidingen worden vroeg of laat altijd door Google herkend en eruit gefilterd.
Dus SEO tactieken of trucjes inzetten omdat het “goed voor Google is” of zelfs om Google te misleiden, is altijd een korte termijn strategie die op de lange termijn tegen je gaat werken.
B. E-E-A-T
Naast de kwaliteit van je pagina’s/content/site speelt het begrip E-E-A-T een grote rol. En ik denk dat dit alleen maar belangrijker wordt, ook buiten de YMYL categorie.
6. Laat E-E-A-T zien, zeker voor YMYL content
- ymylHealthScore – Stores scores of ymyl health classifier as defined at go/ymyl-classifier-dd
- ymylNewsScore – Stores scores of ymyl news classifier as defined at go/ymyl-classifier-dd
Google schrijft in de Search Quality Rater guidelines al jaren over hoe de raters op zoek moeten gaan naar expertise, authoritativeness en trustworthiness. Dat werd al snel afgekort tot E-A-T, wat eind 2022 aangevuld werd met nog een ‘E’, namelijk die van experience.
Trustworthiness is volgens Google zelf de belangrijkste van allemaal.
Ik kijk er altijd zo naar dat de andere onderdelen van E-E-A-T (naast Trust) leiden tot een toename in hoeverre Google jouw pagina’s en hele site kan vertrouwen.
E-E-A-T is onderdeel van Page Quality en heeft dus een belangrijke bijdrage aan wat Google als kwaliteit ziet.
Google schrijft dat deze onderdelen extra belangrijk zijn voor pagina’s en websites met informatie die invloed kan hebben op Your Money or Your Life, afgekort YMYL. Deze classificatie vinden we ook terug in de Google Leak (o.a. in deze module, die voor indexing en serving gebruikt wordt)
Het werken aan E-E-A-T is sowieso een goed idee en ik zie dat Google hier steeds meer op gaat leunen. Maar zeker voor sites in de YMYL categorie is het een must-have en kom je zonder E-E-A-T niet ver meer met SEO (zie voorbeelden hoe dit voor Health sites gedaan kan worden in dit recente artikel)
7. Bouw aan autoriteit op site- en paginaniveau
- siteAuthority – site_authority: converted from quality_nsr.SiteAuthority, applied in Qstar
- authorityPromotion -authority promotion: converted from QualityBoost.authority.boost
- unauthoritativeScore – Unauthoritative score. Used as one of the web page quality qstar signals
Autoriteit is op zich een vaag begrip, maar is duidelijk onderdeel van E-E-A-T. Interessant hier is dat Google een siteAuthority attribuut heeft, dat blijkbaar een autoriteit score aan een site geeft. Dat terwijl de meeste signalen/attributen op pagina/document niveau opgeslagen en beoordeeld worden.
Alledrie de attributen hierboven staan tussen andere interessante attributen in deze module met allerlei kwaliteit signalen, die veel te herleiden zijn naar in de buitenwereld bekende algoritmes/systemen (denk weer aan Google Panda en Product Reviews).
Wat autoriteit precies inhoudt en hoe je dit verbetert, is aan interpretatie onderhevig. Maar ik denk dat het niet al te complex is en neerkomt op een combinatie van factoren zoals links, branded searches, user signals en andere signalen die iets kunnen zeggen over de autoriteit van een pagina of een site.
Dat links – specifiek de PageRank scores – te maken hebben met wat Google als authoritativeness beoordeelt, wordt ook bevestigd door Google’s Elizabeth Tucker in deze recente podcast van Google zelf:
“I would say PageRank, one of our classic Google ranking signals, probably is sort of along the lines of authoritativeness“.
8. Zorg voor een positief sentiment rondom je merknaam
polarity – Polarity represents the sentiment towards the subject.
entitySentiment
Trustworthiness is dus een cruciaal onderdeel voor Google, want zij willen hun zoekmachinegebruikers natuurlijk resultaten voorschotelen die te vertrouwen zijn.
Ik moet weer denken aan de Search Quality Rater guidelines, waarin de raters geïnstrueerd worden om op zoek te gaan hoe er over de site/de organisatie gesproken wordt op internet:
Er zijn dan ook diverse attributen te vinden die het sentiment van een entiteit beoordelen. Dit bevestigt het belang van een positief sentiment rondom je merk.
En dat is iets dat buiten je website en vooral door anderen wordt opgebouwd. Dit is iets dat een lange adem vereist en eigenlijk betekent dat je een plek in de wereld moet verdienen door echt iets toe te voegen.
9. Laat zien welke mensen (auteurs, experts) betrokken zijn bij de totstandkoming van content
- author – Document author(s) / Author of article
- authorName – The username of the author of the microblog post represented by this node.
- profileUrl – Contains the link to the author’s profile url on the platform.
- qualityAuthorshipAuthorAnnotations
Ik zeg vaak dat het bij E-E-A-T in eerste instantie vooral gaat om transparantie. Transparant zijn over hoe je content tot stand komt, wie erbij betrokken zijn, etc.
Dan is het noemen en tonen van je auteurs natuurlijk één van de voor de hand liggende stappen.
Google heeft meerdere attributen waarin ze de auteur opslaan (o.a. in deze module)
Maar alleen het noemen van auteurs zorgt absoluut nog NIET voor goede E-E-A-T “scores”. Want het gaat om AANTOONBARE expertise.
10. Laat zien dat de auteurs/experts aantoonbaar expertise hebben & bouw dit uit
topicExpertise – A topic that creator has expertise in.
Een auteur (of organisatie) is pas waardevol in het kader van E-E-A-T als er aantoonbaar expertise aanwezig is.
Zo vond ik het attribuut topicExpertise in deze module met attributen over Google Maps users.
Het is niet echter moeilijk te bedenken dat Google dit ook op allerlei andere users/auteurs toepast.
Het alleen maar laten zien van je auteurs “omdat dit goed voor Google is” werkt dus niet. Het gaat om aantoonbare expertise = openbaar “bewijs” dat een persoon en/of organisatie expertise heeft.
11. Stop veel effort in het maken van satisfying, helpful content
contentEffort – LLM-based effort estimation for article pages
Ik zeg ook regelmatig tegen mijn klanten dat Googles acroniem E-E-A-T wat mij betreft nóg een ‘E’ mist, namelijk: Effort.
Het staat overduidelijk in Google’s Quality Rater Guidelines: Effort komt er maar liefst 99 keer in voor.
Effort gaat wat mij betreft over de mate waarin de content maker z’n best heeft gedaan om echt helpful, satisfying content te maken.
Dat is precies waar de quality raters een oordeel over moeten geven bij het onderdeel Effort:
En daar heeft Google o.a. het attribuut contentEffort voor (gevonden in deze module over Page Quality).
Het blijft natuurlijk de vraag hoe Google kan meten hoeveel effort in een pagina gestoken is. Maar ik denk dat ze ver komen met machine learning en AI – waar ze met LLM ook naar verwijzen in dit attribuut – getraind op de input die search quality raters geven in hun assessments.
C. Topical autoriteit
Google heeft in basis allereerst het doel om hun gebruikers een zo relevant mogelijk antwoord te geven. Daarvoor moeten ze minimaal weten welke topics een pagina of site over gaat. En, nog belangrijker, welke pagina’s en sites veel topical expertise of autoriteit hebben.
12. Zorg voor een duidelijk “topic profiel” en houd daar focus op
- siteFocusScore – Number denoting how much a site is focused on one topic.
- topicalityRank – Rank of the entity when sorted by topicality score.
- topicExpertise – A topic that creator has expertise in.
Het helpt Google als het heel duidelijk is over welk topic (of meerdere topics) jouw site gaat.
Sterker nog: ik denk dat je alleen maar goed kunt scoren op signalen die met topical expertise te maken hebben als je heel sterk bent in jouw topic(s).
Google meet dan ook in welke mate je site gefocust is op een topic met het attribuut siteFocusScore (gevonden in deze module over Quality en Authority).
13. Zorg dat er niet te veel pagina’s zijn die NIET over je main topic gaan
siteRadius – The measure of how far page_embeddings deviate from the site_embedding
In dezelfde module als siteFocusScore vinden we ook siteRadius. Dit attribuut meet in hoeverre de relevantie van individuele pagina’s afwijkt van die van de hele site.
Wanneer je dus veel pagina’s op je site hebt staan die niet over het hoofdonderwerp van je site gaan, dan vertroebelt dat je topical relevantie.
Zeker als de kwaliteit van de pagina onvoldoende is, dan werkt dat niet in je voordeel wat betreft topical expertise.
14. Gebruik termen in je teksten die dichtbij het hoofdonderwerp liggen
- centrality – Measures how topical this term is to a particular signal. A term like “lincoln” in the Abraham Lincoln’s Wikipedia page should have a centrality close to 1.0 while non-central terms like “florida” should have a centrality close to 0.0.
Al jaren adviseer ik copywriters om in eerste instantie niet na te denken over SEO of wat “goed is voor Google”, maar om gewoon heel goede, behulpzame teksten voor mensen te schrijven.
Wanneer je dat doet, dan heb je in basis vaak al een tekst die in lijn is met waar Google’s algoritmes naar op zoek zijn. Want dan schrijf je iets dat echt problemen oplost, vragen beantwoordt, iets toevoegt, een heldere focus heeft en klopt.
In dat geval zullen er niet zo snel geforceerd begrippen of termen in voorkomen die niet te maken hebben met het hoofdonderwerp van de tekst.
Google meet dit met het attribuut centrality (in deze module), waarbij ze kijken in hoeverre elke term topical relevant is ten opzichte van een ander signaal.
15. Zorg dat uitgaande links (naar andere sites) ook relevant zijn voor het onderwerp
topicalityWeight – The topicality_weight for each link with this target URL. (RepositoryWebrefWebrefOutlinkInfo)
Topicality geldt natuurlijk voor je main content, maar niet alleen voor de tekst of visuele content (zoals afbeeldingen of video’s).
Google meet namelijk ook of de uitgaande links naar andere sites topical relevant zijn met het attribuut topicalityWeight (gevonden in deze module over uitgaande links).
Ik heb vaak de vraag gekregen of uitgaande links weggelaten moeten worden of een nofollow attribuut moeten krijgen, omdat het “niet goed is voor SEO” (want dan zou je linkwaarde verliezen).
Dit is achterhaalde kennis, die misschien 20 jaar geleden in de beginjaren van Google misschien nog wel waar was, in ieder geval specifiek voor het PageRank algoritme.
Maar inmiddels is Google (gelukkig) een stuk verder.
In het kader van E-E-A-T voegen relevante uitgaande links absoluut iets toe, bijvoorbeeld in het kader van transparantie over welke bronnen gebruikt zijn of een gebruiker echt verder helpen met nog meer informatie, uitleg, tools, etc.
D. User signals
Google heeft en gebruikt zoveel data van hun gebruikers om hun producten en diensten continu te verbeteren. Ondanks dat ze dit lang ontkent hebben, weten we nu nog zekerder dat gedrag zoals kliks op zoekresultaten wel degelijk gebruikt wordt.
16. Optimaliseer voor een “lange klik” vanuit Google
- badClicks
- goodClicks
- lastLongestClicks
- unicornClicks – The subset of clicks that are associated with an event from a Unicorn user
- imageQualityClickSignals – Click signals for measuring image quality (e.g., usefulness, presentation, appealingness, and engagingness)
- absoluteImpressions
- chromeInTotal – Site-level Chrome views
- uniqueChromeViews – Number of unique visits in Chrome
- unsquashedClicks – This is not being populated for the current format – instead two instances of CrapsClickSignals (squashed/unsquashed) are used. We are migrating to the new format where this field will be populated.
- unsquashedImpressions – This is not being populated for the current format – instead two instances of CrapsClickSignals (squashed/unsquashed) are used. We are migrating to the new format where this field will be populated.
- unsquashedLastLongestClicks
Als een Google zoeker op een zoekresultaat klikt en daarna niet meer terugkeert naar Google (wat vaak gebeurt in zoeksessies), dan is dat een sterk signaal dat die pagina helpful en satisfying geweest is.
Dat is precies wat het Navboost systeem meet.
In het najaar van 2023 kwam er via de hierboven al genoemde rechtszaak voor het eerst de bevestiging naar buiten dat Google wel degelijk allerlei gebruikersgedrag rondom de zoekresultaten meet en gebruikt in ranking, vooral de kliks op de zoekresultaten.
We leerden toen o.a. het systeem Navboost kennen, dat deze user data 13 maanden opslaat en gebruikt als belangrijke input voor ranking.
Er zijn allerlei modules en attributen te vinden in de Google Leak die over Navboost gaan.
Dus dat is nogmaals een stevige bevestiging dat Google user signals veel gebruikt in ranking (in tegenstelling tot wat ze publiekelijk al jaren beweren).
Belangrijk is dus om te optimaliseren voor goede kliks en “lange” kliks: gebruikers die vanuit Google op je pagina blijven. En dus niet snel terugkeren naar de zoekresultaten, omdat ze blijkbaar niet gevonden hebben wat ze zochten
(Cyrus Shepard was z’n tijd vooruit en schreef daar in 2021 al dit goede artikel over)
Zorg dus d.m.v. klantonderzoek, UX, design, copy, etc. voor echt helpful, satisfying content, zodat gebruikers/bezoekers hun doelen snel & eenvoudig behalen op al jouw pagina’s.
Dit is misschien te groot om een tactiek te noemen, want het is een SEO-strategie (of zelfs marketingstrategie) op zich, maar dit is echt cruciaal om nog succesvol te zijn/blijven in SEO.
E. Linkbuilding
Natuurlijk moeten we het ook hebben over links en linkbuilding. Daar is veel over te vinden in de gelekte Google attributen.
17. Zorg voor links vanaf pagina’s die zelf van goede kwaliteit zijn
- sourceType – is to record the quality of the anchor’s source page and is correlated with but not identical to the index tier of the source page => bepaalt wat de kwaliteit is van de pagina die naar je linkt
- trustedTarget – Following fields record details about trusted anchors True if is this URL is on trusted source.
- trustedTotal – Total number of trusted sources for this URL => aantal backlinks die te vertrouwen zijn
- pagerankWeight – Weight to be stored in linkmaps for pageranker
- penguinEarlyAnchorProtected – Doc is protected by goodness of early anchors
Deze linkbuilding tactiek lijkt een no-brainer, maar in de praktijk zie ik nog steeds vaak iets anders.
Ik zou anno 2024 bijna willen zeggen: linkbuilding is gevaarlijk.
In ieder geval op de manieren zoals het al jaren gedaan wordt (en zoals ik nog steeds heel veel tegenkom in m’n dagelijkse werk).
Google heeft o.a. in deze en deze module veel interessante attributen staan over links.
Veel attributen rondom links gaan over spam en trust. Dat is ook niet gek, omdat dit in de beginjaren de sterkste ranking factor was en daarmee ook het meest gevoelig voor manipulatie.
Niet voor niets worden veel linkbuilding tactieken door Google als spam gezien.
We zien en weten allemaal dat veel linkbuilding tactieken nog steeds effect kunnen hebben op je rankings, maar tegelijkertijd zien we ook dat dit effect verder afneemt met de jaren (ik zag dat zelf duidelijk na de Link spam update eind 2022).
Al blijven er altijd links en vormen van linkbuilding mogelijk die links opleveren die Google wel vertrouwt en meeweegt. Maar daarvoor ligt de lat voor kwaliteit, relevantie, e.d. een stuk hoger dan in het. verleden.
18. Blijf uit de buurt van spammy links
- spamscore2 – 0-127 scale
- spamPenalty – Combined penalty for anchor demotion
- penguinPenalty – Page-level penguin penalty (0 = good, 1 = bad)
- badbacklinksPenalized – Whether this doc is penalized by BadBackLinks, in which case we should not use improvanchor score in mustang ascorer.
- anchorSpamInfo – This structure contains signals and penalties of AnchorSpamPenalizer. It replaces phrase_anchor_spam_info above, that is deprecated.
Je zou zeggen dat je met linkbuilding altijd weg wilt blijven uit de hoek van spammy en dus risicovolle links. Maar de praktijk laat elke dag nog steeds wat anders zien in veel markten.
Google heeft in ieder geval veel link attributen waarmee ze spammy links minder waard of zelfs waardeloos maken.
Het aantal links dat je gerapporteerd krijgt in Ahrefs, Majestic of een ander linkanalyse tool is dus NIET hetzelfde aantal links dat Google daadwerkelijk vertrouwt en meeweegt.
Sterker nog, spammy links kunnen je een demotion opleveren = voor lagere rankings zorgen dan je zou hebben zonder de spammy links.
19. Zorg dat de context van de link (woorden, zinnen, tekst, e.d.) ook relevant is voor de doelpagina
context2 – This is a hash of terms near the anchor
fullLeftContext – The full context. These are not written out in the linklogs.
fullRightContext
Dit is natuurlijk ook een no-brainer. Want als je het omdraait en je voorstelt dat Google de context van een link/anchor NIET mee zou nemen, dan zouden zoveel spammy links waarde hebben (bijv. dummy tekst of tekst in een ander taal met een keyword anchor erin gepropt).
De attributen context2, fullLeftContext & fullRightContext – uit deze interessante module met veel signalen over anchors – kijken naar de woorden en zinnen rondom de link/anchor.
De context van een link moet natuurlijk minimaal relevant zijn om überhaupt een kans te maken dat Google de link waarde geeft.
20. Wees voorzichtig met meerdere links naar je site vanuit dezelfde pagina, zeker voor gekochte links
parallelLinks – The number of additional links from the same source page to the same target domain. Not populated if is_local is true.
In dezelfde module als hierboven staat het attribuut parallelLinks. Hiermee registreert Google of er een 2e link naar dezelfde site toe gaat vanaf dezelfde pagina (behalve voor interne links, wat ze denk ik bedoelen met “Not populated if is_local is true“).
Deze vind ik interessant, omdat ik van mening ben dat 2 of meer links vanuit één artikel inmiddels voor Google vrij eenvoudig te herkennen is als link spam.
In veel landen – en de laatste jaren ook in Nederland – bestaat linkbuilding vaak uit het inkopen van artikelen met links op allerlei sites uit een netwerk/database van een linkboer.
En het standaard product is vaak dat je een artikel koopt met 2 links.
Ik zie nog dagelijks zoveel organisaties – groot en klein – deze vorm van linkbuilding doen.
Maar met de machine learning / AI modellen die Google heeft, kunnen ze natuurlijk eenvoudig een profiel van dit soort links bouwen en deze links herkennen en als spam markeren.
De hierboven al genoemde SEO Dan Petrovic heeft zo’n ML-gedreven oplossing onlangs nagebouwd en zijn tool classificeert artikelen met 2 links naar dezelfde site – zeker met keyword anchors – vaak als unnatural / spammy.
Als zo’n experimentele tool dit al kan herkennen, dan kan Google dat zeker 😉
Wat haal jij uit de Google Leak?
Zoals gezegd, is er volgens mij nog meer waardevols te vinden voor je SEO werkzaamheden in de gelekte Google ranking attributen.
Wat heb jij er voor interessants in gevonden?
Ik ben heel benieuwd, dus laat het zeker achter in de comments 👇
Dank je wel! Veel van wat je zegt, wist ik al. Maar alles nog even samen maakt het alweer een stuk behapbaarder. IK bekijk ook je andere blogs even. Interessant.
Dat is goed om te horen, Christine, dankjewel 🙂