Beschränkungen der Google Search Console API

Mit der Search Console API – oder genauer: der Search Analytics API – hat uns Google ein mächtiges Analyseinstrument an die Hand gegeben. Doch auch dieses Instrument hat Beschränkungen und vielen Nutzern der GSC API sind diese Beschränkungen nicht bewusst.

Dimensionen „query“ und „page“

Kommen die Dimensionen „query“ und „page“ zusammen in einer API-Anfrage vor, werden pro Tag maximal 50.000 Ergebnisse zurückgeliefert. Alle Filter, die wir mit dieser Anfrage kombinieren, arbeiten ebenfalls lediglich auf dieser Teilmenge von 50.000 Ergebnissen! Bereits für mittelgroße Websites schneidet diese Beschränkung spannende Daten ab.

Der einzige mir bekannte Weg, diese Beschränkung zu umgehen, ist die Verwendung zusätzlicher Properties für Verzeichnisse, was natürlich eine entsprechende URL-Struktur voraussetzt. Hast du also eine Website mit den beiden großen Verzeichnissen /produkte und /blog, kannst du zwei Properties anlegen und die genannten Beschränkungen gelten jeweils für beide Properties einzeln. Das heißt, du bekommst für /produkte bis zu 50.000 Ergebnisse und für /blog ebenso.

Kennst du schon mein kleines Tool zum einfachen Zugriff auf die Search Console API? Nein – dann schnell hier entlang zu Stefans Search Console API Explorer.

Diese Beschränkung wird dich bei der explorativen Nutzung der API weniger betreffen, denn wer schaut sich schon manuell 50.000 Ergebnisse für einen Tag an. Wenn du aber die Daten abspeicherst und darauf dann eigene Analysen fährst, solltest du diese Beschränkung kennen.

Dimension „query“ liefert pro Tag maximal 5.000 Ergebnisse

Wird die Dimension „query“ (als alleinige Dimension) benutzt, liefert uns die API sogar nur maximal 5.000 Ergebnisse pro Tag zurück – auch wenn wir rowLimit: 25000 angeben:

{
  "type": "web",
  "startDate": "2021-11-28",
  "endDate": "2021-11-28",
  "rowLimit": "25000",
  "dimensions": [
    "query"
  ]
}

Es gibt aber einen kleinen Workaround, um dieses Problem zu umgehen. Wenn wir zusätzlich nach „page“ filtern , wird diese Beschränkung aufgehoben. Natürlich sollten wir dazu einen Filter nutzen, der nichts wegfiltert, sondern alle Ergebnisse umfasst; es geht nur darum, dass die Dimension „page“ in der Anfrage vorkommt:

{
  "type": "web",
  "startDate": "2021-11-28",
  "endDate": "2021-11-28",
  "rowLimit": "25000",
  "dimensions": [
    "query"
  ],
  "dimensionFilterGroups": [
    {
      "filters": [
        {
          "dimension": "page",
          "operator": "notContains",
          "expression": "sdmfkdjfgfdkgewkrhewtew"
        }
      ]
    }
  ]
}

Mit dieser Anfrage sind dann wieder bis zu 50.000 Ergebnisse pro Tag möglich. Denn letztlich führt die API hier wieder eine Anfrage nach query und page aus.

Grundsätzliche Beschränkungen

Neben den API-spezifischen Problemen, erbt die API natürlich auch die Probleme der Search Console als ganzes. Vor allem ist es ärgerlich, dass in der Search Console nicht alle Suchanfragen angezeigt werden. Dies lässt sich leicht überprüfen. Der Screenshot unten zeigt deutlich, dass eine Seite zwar 25 Klicks generiert hat, aber nur für 18 Klicks werden die Suchanfragen angezeigt. Es gibt viele Beispiele, bei denen das Missverhältnis noch viel erheblicher ist.

Die angezeigten Suchanfragen stimmen aufsummiert nicht mit der Gesamtsumme überein.

Es steht zu vermuten, dass Google dies aus Datenschutzgründen macht. Je spezieller eine Suchanfrage ist, um so höher ist die Wahrscheinlichkeit, dass sie sensible Daten enthält, mit denen auf den Nutzer zurückgeschlossen werden könnte.

So großartig also die Search Console API ist, du solltest dir bewusst sein, dass sie nicht alle Daten liefert, die Google für deine Website hat und dies bei deinen Analysen berücksichtigen.

Ich habe zu diesem Thema einen Vortrag auf der SEOkomm 2021 gehalten. Wenn du ein Ticket für die SEOkomm hattest, kannst du meinen Vortrag – ebenso wie alle anderen Vorträge – noch bis Ende des Jahres online auf onlineexpertdays.com ansehen.