Stichproben bei Googles Suchstatistiken führen zu überraschendem Ergebnis

Die Suchstatistik „Google Trends“ wird vielfältig genutzt. Doch eine Untersuchung im Zusammenschluss von Mitarbeitern des Big-Data-Unternehmens „Hase und Igel“, des NDRs sowie der Universitäten Oldenburg und Hannover haben nun aktuell Überraschendes herausgefunden. Essenzielle Fragen bezüglich der Zuverlässigkeit der Daten stehen jetzt im Raum. Denn das Team hat festgestellt, dass eine identische Suchanfrage bei Google Trends, die zu unterschiedlichen Zeiten gestartet wurde, zu teils starken Abweichungen führt. Das lässt an der Verlässlichkeit der Daten erheblich zweifeln. Und somit daran, ob die kommunizierten Daten das tatsächliche Suchverhalten der Nutzer widerspiegeln.

Insights der Studie finden Sie hier.

Die Datennutzung von Google Trends

Der Suchriese Google startete den Dienst im Jahre 2009. Hintergrund war, Informationen über Nutzeranfragen wie auch die Popularität von Begriffen zu liefern. Wenig später fügte man den Informationen die Möglichkeit hinzu, Besucherzahlen von Domains abzufragen. Hierfür steht dann ein Zeitfenster von wenigen Stunden bis zu 15 Jahren zur Verfügung. Weiterhin kann man separat Regionen und Länder anschauen. Der kostenlose Dienst von Google hat sich durchaus in vielen Branchen zur Prognoseerstellung etabliert.

Die in Google Trends verwendeten Stichproben aus Milliarden täglichen Suchanfragen sind ausreichend, da eine Verarbeitung aller Suchanfragen aufgrund der Datenmenge nicht mehr möglich ist. Zu den kleinen Abweichungen, auch in abgeschlossenen Zeiträumen, kann es kommen, wenn ein Suchbegriff in der betrachteten Periode nur ein sehr geringes Suchvolumen aufweist.

Erklärung von Isabelle Sonnenfeld, Google News Lab-Leiterin, gegenüber dem NDR

Nun ist es schon lange so, dass die Daten aus Google Trends für Entscheidungen herangezogen werden. Das betrifft bei weitem nicht nur die Marketingbranche, sondern unter anderem auch Wissenschaft und Politik. So sollen hier generierte Vergleichswerte vom Sachverständigenrat Wirtschaft für einen Corona-Report genutzt und veröffentlicht worden sein. Unter anderem nutzen auch die Landeskriminalämter zur Recherche im Rahmen von Ermittlungen Google Trends.

Unterschiedliche Ergebnisse bei gleichbleibender Suchabfrage

Das Forschungsteam hat sich nun dafür interessiert, wie aussagekräftig die übermittelten Daten tatsächlich sind. Auch der Fakt, dass von Google Daten kostenfrei zu erhalten sind, die dann allerdings aus einer Untermenge des Suchvolumens ermittelt werden, sollen laut Google durchaus repräsentativ sein.

Doch tatsächlich ergab sich folgendes Ergebnis: Für Hunderte von Abfragen gilt, dass man starke Schwankungen bei den Ergebnissen für bestimmte Suchanfragen erhielt. Das gilt anscheinend auch für historische Daten – nur einige Ergebnisse aus bestimmten Konstellationen sind verwertbar. Somit kann man wohl nicht von einer Repräsentativität reden. Manchmal wiesen die Trends, auch wenn nur eine Stunde zwischen der Abfrage desselben Suchbegriffs lag, sogar in komplett verschiedene Richtungen. Das entbehrt jeglicher Logik.

Entlarvtes Ausmaß der Abweichungen vs. Googles Erklärung

Nachdem das Beraterteam erste Diskrepanzen entlarvt hatte, hat man das Team mit Forschern verstärkt. Dann war klar, dass das Ausmaß der immer wiederkehrenden Widersprüche vor allem in Analyse-Zeiträumen von weniger als acht Monaten so gravierend waren, dass eine Analyse als verfälscht ausgesehen werden kann. Eine Repräsentativität ist in vielen Fällen schlicht und einfach nicht gegeben.

Google selbst hat nach der Konfrontation mit den Resultaten nicht ausreichend geantwortet. Man schiebt auftretende Abweichungen in Mountain View auf ein geringes Suchvolumen, was in manchen Abfragen in Zusammenhang gesetzt werden kann. Allerdings können nur ungefähr 50 Prozent der Abfragen in einen Zusammenhang von Suchvolumen und Datenqualität gesetzt werden, der Rest der Ungereimtheiten bleibt.

Die Forscher resümieren, dass hier noch zusätzliche Faktoren die Schere bei den Ergebnissen vergrößern, das allerdings muss von Google selbst aufgeklärt werden. Fakt ist, dass das Ergebnis dieser Studie zeigt, dass die Nutzung von Google Trends wohl mit einem Risiko behaftet ist. Noch dazu hat die Studie festgestellt, dass allein der ausgegebene Indexwert auch nur teilweise auf das reale Suchvolumen hinweist. Wir bleiben gespannt, ob Google noch eine weitere Reaktion mit zusätzlichen Erklärungen zeigt.

1 Kommentar
  1. SandstrandSEO
    SandstrandSEO sagte:

    Ich bin auch immer wieder erstaunt was sich in den Trends befindet. Egal ob bei YouTube oder Google – die Trends sind meist schon abenteuerlich und spiegelt meist die heutige Gesellschaft oder zumindest einen Großteil dieser wieder. Deinen Beitrag zu dieser Thematik finde ich sehr erfrischend und hatte Freude dabei ihn zu lesen.

    Antworten

Beitrag kommentieren

Wir freuen uns auf Ihr Feedback!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diesen Beitrag bewerten