Am 13. März 2024 wurde eine riesige Menge interner Google-Dokumente auf Github veröffentlicht, die einen tiefen Einblick in den Google-Ranking-Algorithmus bieten. Diese Dokumente stammen offenbar aus Googles internem Content API Warehouse und wurden von einem automatisierten Bot namens yoshi-code-bot veröffentlicht. Rand Fishkin, Mitbegründer von SparkToro, erhielt diese Dokumente im Mai und teilte sie mit Michael King, dem CEO von iPullRank.

Inhaltsverzeichnis

Was die geleakten Dokumente enthalten

Die geleakten Dokumente geben einen beispiellosen Einblick in die Funktionsweise von Google Search und zeigen einige der wichtigsten Elemente, die Google zur Bewertung von Inhalten verwendet. Zu den Erkenntnissen gehören:

  • Ranking-Funktionen: Die Dokumentation zeigt 2.596 Module mit 14.014 Attributen.
  • Demotions: Inhalte können aus verschiedenen Gründen herabgestuft werden, wie z.B. unpassende Links, SERP-Signale, die auf Benutzerunzufriedenheit hinweisen, oder bestimmte Arten von Domains.
  • Links: Linkdiversität und Relevanz bleiben Schlüsselkomponenten, und der PageRank wird weiterhin berücksichtigt.

Wichtige Erkenntnisse aus den Dokumenten

Rand Fishkin und Michael King haben einige bemerkenswerte Punkte aus den geleakten Dokumenten hervorgehoben:

Aktualität der geleakten Dokumente

Die Dokumentation gibt an, dass diese Informationen ab März 2024 aktuell sind. Dies bedeutet, dass die vorgestellten Funktionen und Module zurzeit aktiv sind oder kürzlich verwendet wurden.

Twiddlers

Twiddlers sind Funktionen zur Nachsortierung, die das Informationsabruf-Score eines Dokuments anpassen oder die Platzierung eines Dokuments bzw. einer Webseite ändern können. Diese Funktionen können die Reihenfolge der Suchergebnisse vor der Anzeige für den Benutzer ändern.

Links bleiben von großer Bedeutung für die Ranking-Bewertung. Die Vielfalt und Relevanz der Links sowie der PageRank für die Homepage einer Website werden weiterhin in Betracht gezogen.

Erfolgreiche Klicks

Google verwendet verschiedene Messungen, um den Erfolg von Klicks zu bewerten, darunter badClicks, goodClicks, lastLongestClicks und unsquashedClicks. Längere Dokumente könnten gekürzt werden, während kürzere Inhalte nach Originalität bewertet werden.

Click Factor Quality Navboost (GoogleApi.ContentWarehouse)

Bemerkenswerte Funde aus den Dokumenten

Die geleakten Dokumente enthalten auch einige bemerkenswerte und ungewöhnliche Erkenntnisse:

Sandbox

Ein Attribut namens „hostAge“ wird verwendet, um neue Websites in eine Sandbox zu stellen, was im Widerspruch zu Googles öffentlicher Behauptung steht, dass es keine Sandbox gibt.

Chrome-Daten

Ein Modul namens ChromeInTotal zeigt, dass Google Daten aus seinem Chrome-Browser für die Ranking-Bewertung verwendet, was Google bisher bestritten hat.

Architektur

Das Ranking-System von Google besteht aus einer Reihe von Mikroservices, darunter Trawler (Crawling), Alexandria (Indexierung), Mustang (Ranking) und SuperRoot (Anfragenverarbeitung).

Unsere detaillierte Analyse der Module und Funktionen

Twiddlers und ihre Auswirkungen

Twiddlers sind Nachsortierfunktionen, die das Informationsabruf-Score eines Dokuments oder die Platzierung eines Dokuments ändern können, kurz bevor es dem Benutzer präsentiert wird. Sie fördern die Vielfalt, indem sie die Art der Ergebnisse in einer SERP begrenzen. Diese Funktionen spielen eine wichtige Rolle bei der Feinabstimmung der Suchergebnisse und der Anpassung an spezifische Nutzerbedürfnisse.

  • NavBoost: Ein System, das auf Click-Daten basiert und die Platzierung von Suchergebnissen beeinflusst.
  • QualityBoost: Ein Twiddler, der die Qualität von Ergebnissen bewertet und entsprechende Anpassungen vornimmt.
  • RealTimeBoost: Ein Twiddler, der in Echtzeit auf aktuelle Ereignisse und Trends reagiert, um relevante Ergebnisse zu liefern.

Title-Tags

Title-Tags spielen eine wesentliche Rolle in Googles Ranking-System, indem sie den Inhalt einer Webseite kurz und prägnant beschreiben. Sie sind nicht nur für die Benutzererfahrung wichtig, sondern auch für die Suchmaschinenoptimierung (SEO). Hier sind einige wichtige Punkte zu Title-Tags aus den geleakten Dokumenten:

  • TitlematchScore: Der Titelabgleich-Score (titlematchScore) einer Seite ist ein Signal dafür, wie gut Titel mit Benutzeranfragen übereinstimmen. Im Dokument heißt es dazu: „Titlematch score of the site, a signal that tells how well titles are matching user queries
  • „HtmlTitleFp (HTML-Titel-Fingerprint): Der Fingerprint des HTML-Titels einer Seite wird verwendet, um die Authentizität und Konsistenz der Seite sicherzustellen. Dies hilft dabei, dass die Seite bei der Websuche korrekt dargestellt wird. Ein Zitat aus dem Dokument beschreibt dies folgendermaßen: „Fingerprint des HTML-Titels der Seite. Dies ist nützlich, um zu überprüfen, ob wir die gleiche Version der Seite wie bei der Websuche haben“
  • Titel: Der Titel des Artikels wird als wichtig erachtet, insbesondere wenn der HTML-Titel der Seite nicht optimal ist.
  • VideoContentSearchSpanDolphinFeatures: Der Titel eines Videos ist ein entscheidender Faktor bei der Bewertung und Auffindbarkeit von Videoinhalten. Im Dokument wird dies beschrieben als: „Der Titel des Videos wird als wichtiger Faktor bei der Inhaltsevaluierung angesehen“

Keywords

Keywords sind zentrale Elemente in der SEO, die verwendet werden, um den Inhalt einer Seite zu kategorisieren und deren Relevanz für spezifische Suchanfragen zu bestimmen. Hier sind die wichtigsten Punkte zu Keywords:

  • Keywords und Schlüsselphrasen für Entitäten. Das Dokument erklärt: „Spezifische Keywords und Schlüsselphrasen sind entscheidend für Entitätsprofile, um die Relevanz und Auffindbarkeit von Inhalten zu verbessern“
  • Qualitätsbewertung von Ankern: Die Qualität von Ankern (Links) wird auch durch die enthaltenen Keywords beeinflusst. Dies hilft bei der Bestimmung der Relevanz und Qualität der verlinkten Inhalte. Im Dokument heißt es: „Für Ranking-Zwecke wird die Qualität eines Ankers durch seine ‚locality‘ und ‚bucket‘ gemessen… die enthaltenen Keywords beeinflussen dies“.
  • Dokumenten-NLP-Analyse: Google verwendet Natural Language Processing (NLP), um Named Entities, Schlüsselwörter und Schlüsselphrasen innerhalb eines Dokuments zu identifizieren und zu analysieren. Dies trägt dazu bei, die Relevanz und den Kontext der Inhalte besser zu verstehen.

KeywordProfile NLP GoogleApi.ContentWarehouse

VoltSignal (Core Web Vitals)

Das Volt-Signal bezieht sich auf Googles Bewertung der Core Web Vitals (CWV), die wesentliche Metriken zur Bewertung der Leistung und Benutzererfahrung einer Webseite darstellen.

Die Core Web Vitals sind wesentliche Bestandteile der allgemeinen Benutzererfahrung auf einer Webseite und sie sind im Volt-Signal enthalten. Das Dokument erwähnt, dass diese Metriken aus den aggregierten 75-Prozent-Werten der UKM (User Key Metrics) extrahiert werden, was darauf hinweist, dass Google eine erhebliche Menge an Benutzerdaten verwendet, um diese Signale zu bewerten.

Verwendung des Volt-Signals

  • Datenspeicherung und Nutzung: Das Protokollpuffer für das Volt-Signal wird in der Legacy-Daten-Muppet-Anlage für VOLT gespeichert. Diese Daten werden speziell für Ranking-Änderungen verwendet, was impliziert, dass Webseiten mit besseren Core Web Vitals wahrscheinlich höher in den Suchergebnissen ranken.
  • Gespeicherte Komponenten: Nur CWV-Signale und sichere Signale werden in diesem System gespeichert. Andere Signale wie Mobile Friendliness werden separat gespeichert.

Anchor Handling

Google verfolgt eine Vielzahl von Anker-Attributen, einschließlich der Qualität und des Kontexts der Ankertexte. Diese Informationen sind entscheidend für die Bewertung der Relevanz und Vertrauenswürdigkeit von Links.

  • AnchorsAnchor: Speichert Informationen wie die Originaltexte, die Schriftgröße und das Datum des ersten Auftretens eines Ankers. Diese Attribute helfen Google, die Relevanz und Qualität der verlinkten Inhalte zu bewerten.
  • Anchor Handling Context: Bewertet den Kontext, in dem ein Anker verwendet wird, um seine Relevanz zu bestimmen.
  • sourceType: Bewertet die Qualität der Quelle eines Links und ordnet diese in Qualitätsstufen ein.

Ein weiteres wichtiges Modul ist das NavBoost-System, das Nutzersignale wie Klicks und Verweildauer analysiert, um die Qualität und Relevanz von Suchergebnissen zu bewerten. Laut der Aussage von Pandu Nayak, Vizepräsident der Suche bei Google, wurde dieses System 2005 eingeführt, um Klickstromdaten zu sammeln und die Suchqualität zu verbessern. Diese Daten wurden ursprünglich über die Google Toolbar PageRank erfasst. Der Wunsch nach mehr Daten könnte auch zur Entwicklung des Chrome-Browsers, der 2008 implementiert wurde, geführt haben. Dies wurde im Rahmen eines DOJ-Falls besprochen, der untersuchte, wie Google seine marktbeherrschende Stellung ausnutzt. Die jetzt geleakten Dokumente zeigen, dass NavBoost immer noch einen zentralen Stellenwert im Google-Algorithmus hat.

NavBoost verwendet verschiedene Arten von Nutzersignalen, um Suchergebnisse zu verbessern:

  • GoodClicks und BadClicks: Bewertet Klicks basierend auf ihrer Qualität und dem Nutzerverhalten nach dem Klick.
  • LastLongestClicks: Misst die Verweildauer auf einer Seite, um die Relevanz des Inhalts zu bewerten.
  • UnicornClicks: Bezieht sich auf extrem seltene, aber qualitativ hochwertige Klicks.

Diese Signale sind entscheidend, um die Nutzererfahrung zu verbessern und sicherzustellen, dass relevante und nützliche Inhalte bevorzugt angezeigt werden.

Geografische und demografische Anpassungen

Google nutzt geografische und demografische Daten, um Suchergebnisse anzupassen:

  • AbuseiamGeoRestrictionLocale: Stellt sicher, dass bestimmte Inhalte nur in bestimmten Regionen zugänglich sind.
  • NavBoost geo-fences: Verwendet Klickdaten basierend auf geografischen Standorten, um die Relevanz von Suchergebnissen zu optimieren.
  • AppsPeopleOzExternalMergedpeopleapiAgeRangeType: Enthält Informationen über das Alter der Nutzer, was besonders für altersbeschränkte Inhalte wichtig ist.
  • AppsPeopleOzExternalMergedpeopleapiGender: Verwendet Geschlechtsdaten, um die Relevanz und Personalisierung von Inhalten zu verbessern.

Diese Anpassungen zeigen, wie Google versucht, die Suchergebnisse für verschiedene Nutzergruppen relevanter und nützlicher zu gestalten.

Autoren und SiteAuthority

Google sammelt und verwendet umfangreiche Informationen über die Autoren von Inhalten:

  • AppsPeopleOzExternalMergedpeopleapiAuthor: Speichert Informationen über Autoren und ihre Veröffentlichungen, was zur Bewertung der Vertrauenswürdigkeit und Relevanz der Inhalte beiträgt.
  • SiteAuthority: Bewertet die Gesamtqualität einer Website basierend auf verschiedenen Faktoren wie Linkqualität und Nutzerengagement.

Diese Module unterstreichen die Bedeutung von qualitativ hochwertigen Inhalten und vertrauenswürdigen Autoren für das Ranking in den Suchergebnissen.

siteAuthority GoogleApi.ContentWarehouse

AbuseIAm Modules

Diese Module sind verantwortlich für die Klassifizierung und Einschränkungen im Zusammenhang mit Missbrauch, wie z.B. Pornographie, Altersbeschränkungen und geografische Einschränkungen. Einige Beispiele umfassen:

  • AbuseiamAbuseType: Klassifiziert verschiedene Arten von Missbrauch, einschließlich Pornographie und anderen sensitiven Inhalten.
  • AbuseiamAgeRestriction: Legt Altersgrenzen für den Zugriff auf Inhalte fest.
  • AbuseiamGeoRestriction: Definiert geografische Einschränkungen basierend auf dem Standort des Nutzers.

Diese Module zeigen, wie Google Inhalte basierend auf rechtlichen und ethischen Standards reguliert, um die Nutzererfahrung zu verbessern und gesetzliche Vorgaben einzuhalten.

AppsPeople Modules

Diese Module enthalten umfassende Informationen über Nutzerprofile, einschließlich ihrer Interaktionen, Interessen und sozialen Verbindungen. Beispiele beinhalten:

  • AppsPeopleOzExternalMergedpeopleapiPerson: Kombiniert mehrere Datenquellen wie Kontakte und Profile zu einem umfassenden Nutzerprofil.
  • AppsPeopleOzExternalMergedpeopleapiInterest: Verfolgt die Interessen eines Nutzers, um personalisierte Suchergebnisse zu liefern.
  • AppsPeopleOzExternalMergedpeopleapiActivityStreamqualityDistillerEngagements: Speichert und analysiert Nutzerinteraktionen, um die Qualität der Suchergebnisse zu verbessern.

Weitere bemerkenswerte Module / Konzepte

Die Dokumente enthalten auch Informationen über eine Vielzahl weiterer Module, die für die Bewertung und Klassifizierung von Inhalten verwendet werden. Ein kleiner Ausschnitt:

  1. AbuseiamNameValuePair: Enthält Name-Wert-Paare, die zur Klassifizierung von Inhalten verwendet werden. Diese Paare sind essenziell, um schädliche Inhalte zu identifizieren und zu kategorisieren.
  2. AnchorsRedundantAnchorInfo: Verarbeitet redundante Ankerinformationen, um die Qualität der Linkstruktur zu bewerten. Eine gute Linkstruktur ist entscheidend für die SEO-Performance.
  3. CompositeDocIndexingInfo: Enthält Informationen, die hauptsächlich innerhalb der Indizierung verwendet werden. Diese Informationen beeinflussen, wie Inhalte in den Suchergebnissen erscheinen.
  4. CompositeDocQualitySignals: Enthält Daten, die sich hauptsächlich auf die Aktualität beziehen. Aktuelle Inhalte haben eine höhere Chance, besser zu ranken.
  5. CompressedQualitySignals: Beinhaltet komprimierte Qualitätssignale, die in der Vorbewertung verwendet werden. Diese Signale helfen dabei, die Relevanz von Seiten schneller zu bestimmen.
  6. ConceptsConceptId: Speichert Konzept-IDs zur Identifizierung von Konzepten. Die korrekte Identifizierung von Konzepten kann die Relevanz und Zuordnung von Inhalten verbessern.
  7. ContentAttributions: Speichert Zuordnungen von Inhalten von einer Seite zu einer anderen, um die ursprüngliche Quelle zu würdigen. Dies fördert die Anerkennung der Originalquelle und verbessert die Vertrauenswürdigkeit.
  8. CompositeDocLocalizedVariations: Beinhaltet lokalisierte Variationen von URLs basierend auf regionalen und sprachlichen Präferenzen. Lokalisierte Inhalte können gezielt in regionalen Suchergebnissen besser ranken.
  9. CompositeDocRobotsInfoList: Listet Robots-Informationen für verschiedene User-Agents auf. Diese Informationen helfen dabei, Suchmaschinen-Crawlern spezifische Anweisungen zu geben, wie Inhalte zu behandeln sind.
  10. CompositeDocPartialUpdateInfo: Enthält Informationen über teilweise Updates in einem CompositeDoc. Regelmäßige Updates können die SEO-Performance durch anhaltende Relevanz und Aktualität verbessern.
  11. IndexSelectionScore: Beeinflusst, ob eine Seite im Hauptindex oder im ergänzenden Index landet. Seiten im Hauptindex haben bessere Chancen, in den Suchergebnissen höher zu erscheinen.
  12. NumBackwardLinks: Die Anzahl der Rückverweise ist ein starker Indikator für die Autorität und Vertrauenswürdigkeit einer Seite.
  13. PublicationDate: Das Veröffentlichungsdatum kann die Frische und Aktualität der Inhalte beeinflussen, was sich positiv auf die SEO auswirkt.
  14. SourceTypeBitfield: Indiziert, wie der Inhalt einbezogen wurde, was Aufschluss über die Herkunft und Art der Inhalte gibt.

Whitelists und spezielle Restriktionen

Ein weiteres wichtiges Thema in den geleakten Dokumenten sind Whitelists und spezielle Restriktionen, die Google für bestimmte Inhalte anwendet.

Whitelists

Google verwendet Whitelists, um sicherzustellen, dass bestimmte vertrauenswürdige Websites bevorzugt in den Suchergebnissen erscheinen:

  • AbuseiamVerdictRestriction: Verwendet spezielle Restriktionen, um sicherzustellen, dass bestimmte Inhalte nur unter bestimmten Bedingungen angezeigt werden.
  • isCovidLocalAuthority und isElectionAuthority: Diese Module zeigen, dass Google während der Covid-19-Pandemie und bei Wahlen Whitelists verwendet hat, um die Relevanz und Vertrauenswürdigkeit der angezeigten Informationen sicherzustellen.

Diese Module verdeutlichen, wie Google versucht, die Qualität und Relevanz der Suchergebnisse zu maximieren, indem es bestimmte vertrauenswürdige Quellen bevorzugt.

Zusätzliche Einblicke aus dem Leak

Nutzung von Browserdaten

Ein kontroverses Thema, das aus den Dokumenten hervorgeht, ist die Nutzung von Browserdaten zur Ranking-Bewertung. Das Modul „ChromeInTotal“ zeigt, dass Google Daten aus seinem Chrome-Browser verwendet, um das Nutzerverhalten zu analysieren und die Relevanz von Inhalten zu bewerten. Dieses Modul wird konkret zur Seitenqualitätsbewertung eingesetzt und enthält Messungen der Seitenaufrufe durch Chrome-Nutzer auf Seitenebene..

chromeInTotal google_api_content_warehouse

Verwendung von NavBoost

NavBoost, ein System, das Click-Daten analysiert, spielt eine zentrale Rolle bei der Bewertung von Suchanfragen. Es berücksichtigt nicht nur die Anzahl der Klicks, sondern auch die Dauer der Klicks (long vs. short clicks) und das anschließende Benutzerverhalten. Dies zeigt, wie detailliert Google das Nutzerverhalten analysiert, um die Relevanz und Qualität von Inhalten zu bewerten.

Quality Rater Feedback

Die Dokumente zeigen, dass Google Feedback von Quality Ratern in den Bewertungsprozess einbezieht. Hintergrund: Es ist schon länger bekannt, dass Google ein Bewertungssystem namens EWOK nutzt. Der aktuelle Leak liefert konkrete Hinweise darauf, dass die von den Qualitätsbewertern generierten Signale tatsächlich in den Suchalgorithmen verwendet werden und nicht nur zu Testzwecken dienen. Die Dokumente zeigen, dass diese Signale in verschiedenen Modulen integriert sind und eine aktive Rolle bei der Feinabstimmung und Verbesserung der Suchergebnisse spielen. Die genaue Nutzung und der Einfluss dieser Signale sind zwar nicht immer eindeutig, aber es ist klar, dass sie mehr als nur experimentellen Charakter haben.

Details aus dem Dokument:

  • Integration der Signale in Module: Die von Qualitätsbewertern generierten Signale werden in verschiedenen Modulen des Suchsystems verwendet. Dies wird in den Dokumenten deutlich, wo spezifische Hinweise und Anmerkungen gemacht werden, dass diese Signale nicht nur zu Testzwecken verwendet werden, sondern in den aktiven Suchalgorithmen enthalten sind​
  • Sammeln und Integrieren der Daten: Es gibt detaillierte Beschreibungen darüber, wie die Bewertungen und Daten von Qualitätsbewertern gesammelt und in die Suchsysteme integriert werden. Diese Informationen sind in den Protokollen der verschiedenen Module und Systeme des Dokuments festgehalten​
  • Aktive Rolle der Signale: Die genaue Verwendung und der Einfluss der Bewerter-Signale sind nicht immer eindeutig, aber es gibt Abschnitte im Dokument, die darauf hinweisen, dass diese Signale zur Feinabstimmung und Verbesserung der Suchergebnisse verwendet werden. Dies zeigt, dass die Daten von Qualitätsbewertern eine aktive Rolle in den Suchalgorithmen spielen können..

EWOK

Geo-Fencing von Click-Daten

Google verwendet Geo-Fencing, um Click-Daten auf Länderebene und sogar auf Ebene von Bundesstaaten oder Provinzen zu segmentieren. Dies bedeutet, dass Suchanfragen und Klicks je nach geografischem Standort unterschiedlich bewertet werden können. Wenn Google jedoch nicht genügend Daten für bestimmte Regionen oder Benutzeragenten hat, kann es diese Prozesse universell auf die Suchergebnisse anwenden.

Offene Fragen

Die Dokumentation lässt einige Fragen offen, wie die mögliche Verbindung zwischen dem Helpful Content Update und „Baby Panda“ sowie die Bedeutung von NSR (Neural Semantic Retrieval).

Enthält das Dokument Informationen zur Gewichtung der Ranking-Faktoren?

Nein, das Dokument enthält keine Informationen zur Gewichtung der Ranking-Faktoren. Allerdings bezieht es sich an verschiedenen Stellen auf verschiedene Rankingsignale.

Hier sind einige relevante Punkte:

PageRank-Gewichtung

  • PageRank-Gewichte werden in Linkmaps für den PageRank-Algorithmus gespeichert

Core Web Vitals (Volt Signal)

  • Ladeleistung, Interaktivität und visuelle Stabilität werden im Volt-Signal zusammengefasst und für Ranking-Änderungen verwendet

Mobile Friendliness

  • Mobile Friendliness ist ein wichtiges Ranking-Signal, das getrennt gespeichert wird

Sichere Signale

  • Sichere Signale wie HTTPS haben Einfluss auf das Ranking und werden getrennt gespeichert
  • Informationen über ausgehende Links (Outlinks) und ihre Qualität beeinflussen das Ranking

Entitäts- und Mention-Scores

  • Scores zu Entitäten und Erwähnungen innerhalb des Contents werden zur Relevanzbewertung herangezogen

Nutzerverhalten

  • Das Dokument erwähnt die Analyse des Nutzerverhaltens wie Klickraten (Click-Through Rates), die ebenfalls als Signale dienen

Content-Qualität

  • Die Qualität und Originalität des Inhalts werden bewertet und beeinflussen das Ranking
  • Die Dokumente beschreiben Signale, die mit der Nutzerinteraktion und Navigation auf der Seite zusammenhängen, wie z.B. Click-Through Rates und andere Interaktionsmetriken

SEO-Implikationen und Empfehlungen

Die geleakten Dokumente betonen die Wichtigkeit von hochwertigem Inhalt, Benutzerengagement und strategischem Linkaufbau. Hier sind einige spezifische Empfehlungen basierend auf den enthüllten Informationen:

Hochwertiger Inhalt

Google legt großen Wert auf die Qualität und Originalität des Inhalts. Seiten sollten:

  • Originalität betonen: Einzigartige und informative Inhalte werden bevorzugt.
  • Benutzerfreundlichkeit: Inhalte sollten gut strukturiert und leicht lesbar sein.
  • Schlüsselwörter strategisch platzieren: Schlüsselwörter sollten natürlich und kontextbezogen verwendet werden.

Benutzerengagement

Das Nutzerverhalten spielt eine entscheidende Rolle bei der Bewertung von Webseiten:

  • Verweildauer: Längere Aufenthalte auf der Seite können ein Zeichen für hochwertigen Inhalt sein.
  • Klickverhalten: Positive Nutzerinteraktionen wie längere Klicks und geringe Absprungraten werden bevorzugt.

Linkaufbau

Links bleiben ein zentraler Faktor für das Ranking:

  • Vielfalt und Relevanz: Eine vielfältige und relevante Linkstruktur ist entscheidend.
  • Qualität der Links: Hochwertige Links von vertrauenswürdigen Quellen haben einen größeren Einfluss.

FAQ zum Google Ranking Algorithmus Leak

Sie können die geleakten API-Dokumentationen hier einsehen.
Ja und Nein. PagerankNS / Pagerank-NearestSeeds  ist an die Stelle des alten PageRanks getreten. Vermutlich ist das ein spezifischer Algorithmus, der die klassische PageRank-Berechnung verbessert oder anpasst. Hier sind einige mögliche Eigenschaften und Funktionsweisen dieser Methode:

  1. Seeds Definition: „Seeds“ sind ausgewählte, vertrauenswürdige Knoten im Webgraphen, die als Ausgangspunkte für die PageRank-Berechnung dienen. Diese Knoten könnten auf bestimmte Weise ausgewählt werden, z.B. basierend auf ihrer Relevanz oder Vertrauenswürdigkeit.
  2. Nearest Seeds Approach: Die Methode könnte darauf abzielen, den Einfluss dieser Seeds auf nahegelegene Knoten (Seiten) im Graphen zu berechnen. Dabei wird der PageRank-Wert einer Seite stärker durch die Nähe zu einem oder mehreren dieser Seeds bestimmt.
  3. Effizienz und Genauigkeit: Diese Methode könnte effizienter sein als der klassische PageRank-Algorithmus, indem sie die Berechnungen auf relevante Teile des Webgraphen beschränkt. Dies könnte auch die Genauigkeit der PageRank-Bewertung erhöhen, indem sie die Verbindungen und Relevanzen im Kontext der Seeds besser berücksichtigt.
  4. Iterative Berechnung: Ähnlich wie beim klassischen PageRank-Algorithmus könnte die Nearest Seeds-Methode iterative Berechnungen verwenden, um die PageRank-Werte zu stabilisieren. Dabei könnten die Werte von den Seeds ausgehen und sich durch den Graphen verbreiten, bis sie konvergieren.
  5. Gewichtung der Verbindungen: Die Methode könnte auch unterschiedliche Gewichte für Verbindungen (Links) zu und von den Seeds verwenden, um die Bedeutung dieser Verbindungen zu betonen.
Die geleakten Dokumente zeigen, dass Google ein Feature namens ’siteAuthority‘ berechnet. Obwohl die genaue Berechnung und Verwendung unklar bleibt, ist nun definitiv, dass Google eine Gesamt-Domain-Autorität misst, was ihren öffentlichen Aussagen widerspricht.

NavBoost ist ein Ranking-System, das Click-basierte Maßnahmen verwendet, um die Rankings in der Websuche zu beeinflussen. Es ist seit etwa 2005 im Einsatz und verwendet rollierende 13 Monate an Click-Daten.

Google analysiert Click-Daten mit dem NavBoost-System, das die Anzahl der Clicks, die Dauer dieser Clicks und das Benutzerengagement bewertet. Diese Daten helfen Google, die Qualität einer Website zu bewerten und die Gewichtung von Links zu bestimmen.

Twiddlers sind Nachsortierfunktionen, die das Informationsabruf-Score eines Dokuments ändern können, bevor es dem Benutzer präsentiert wird. Sie fördern die Vielfalt und spielen eine wichtige Rolle bei der Feinabstimmung der endgültigen Suchergebnisse.

Die „AbuseIAm“-Module sind darauf spezialisiert, Inhalte zu klassifizieren und Beschränkungen im Zusammenhang mit Missbrauch festzulegen. Sie umfassen verschiedene Arten von Einschränkungen, wie Altersgrenzen, geografische Einschränkungen und spezifische Klassifizierungen von Missbrauch.

Google verwendet Module wie „AbuseiamGeoRestriction“, um geografische Einschränkungen auf Inhalte anzuwenden. Dies bedeutet, dass Nutzer in verschiedenen Regionen möglicherweise unterschiedliche Inhalte sehen oder Zugangsbeschränkungen haben, basierend auf spezifischen regionalen Regeln.

Google bewertet Backlinks anhand mehrerer Kriterien. Sowohl direkte als auch indirekte Links werden berücksichtigt. Der Ankertext und der umgebende Kontext sind entscheidend. Links von hochrangigen Seiten sind wertvoller, wobei die Qualität und Aktualität der Links bevorzugt werden. Links aus derselben Domain haben spezifische Bewertungen, und redundante Anker von derselben Domain werden minimiert. Spam-Links werden erkannt und bestraft. Schließlich beeinflusst die Qualität der verlinkenden Seite die Wertigkeit des Backlinks maßgeblich.

Nutzerinteraktionen sind ein wichtiger Bestandteil von Googles Bewertungsprozess. Google sammelt Daten über verschiedene Arten von Engagements und verwendet diese Informationen, um die Relevanz und Qualität von Inhalten zu bewerten.

PageRank PageRankNS google_api_content_warehouse

Fazit

Der große Leak der Google-Ranking-Algorithmen hat viele bisher unbekannte Details über die Funktionsweise von Google Search enthüllt. Für SEOs und digitale Vermarkter bietet dieser Einblick wertvolle Informationen, um ihre Strategien zu verbessern und erfolgreicher zu werden. Es bleibt abzuwarten, wie Google auf diesen Leak reagieren wird und welche langfristigen Auswirkungen er auf die SEO-Community haben wird. Die detaillierten Einblicke in die verschiedenen Module und deren Funktionen zeigen, wie komplex und umfangreich Googles Bewertungsprozess tatsächlich ist.