Reverse Link-Engineering: Crawler-based Market Research

Unsere Campixx-Session zur Marktanalyse mit (mehr oder weniger komplizierten) Crawlern hat ja zu spannenden Diskussionen geführt und den vielfachen Wunsch, die Slides zu veröffentlichen. Thomas Mindnich und ich waren uns von vornherein einig, dass wir nicht alles, was wir in der Session zeigen würden, hinterher veröffentlichen möchten. Aus unserer Sicht ist die Campixx ein Ort, auch mal etwas offener zu reden und Dinge zu zeigen, die wir auf einer „normalen“ Konferenz nicht zeigen würden. Ich habe deshalb für alle Interessierten die Slides in anonymisierter Form aufbereitet und hier zum Download (PDF, 2.9 MB) bereit gestellt.

Durch die Session zog sich als roter Faden die Frage, wie wir Crawler-Daten über unser Konkurrenzumfeld bekommen können. Das ging mit so simplen Tools wie Screaming Frog los und endete bei zwei kleinen selbstgeschriebenen Crawlern.

Die (wenigen) kritischen Stimmen bezogen sich auf den Live-Teil des Vortrags, der zeitlich den größten Teil einnahm. Anders als aber verschiedentlich vom Hörensagen aus der Session berichtet wurde, haben wir aber weder ein Linknetz aufgedeckt noch haben wir das Backlink-Profil einer einzelnen Website analysiert. Unser vorgestelltes Tool macht nichts anderes, als die Blogpings vom Dienst weblogs.com zu holen und die als aktualisiert gemeldeten Seiten zu besuchen. Können dort dann tatsächlich neue Artikel gefunden werden, so crawlen wir diese und schreiben die gefundenen Links in eine Datenbank. Auf diese Weise sieht man einen Teil des Backlink-Profils auf der zeitlichen Dimension und erschrickt manchmal geradezu, wie auffällig ein Backlinkaufbau plötzlich aussehen kann.

Wir haben den Live-Teil mit drei Brands begonnen, die uns eher zufällig in den Sinn kamen. Die ersten beiden drehten sich um Mode, der dritte um Elektronik. Bei allen dreien gab es kaum etwas auszusetzen, wir fanden lediglich einen Artikelverzeichnis-Artikel, der neben einem Moneykeyword-Link auf den Elektronik-Shop auch noch gleich einen Link auf den Autor, einen nicht ganz unbekannten SEO, enthielt.

Anschließend zeigten wir welche Websites in den letzten Tagen mit besonders vielen verschiedenen Money-Keywords aus dem Kreditbereich verlinkt wurden. Dort griffen wir eine einzelne Website heraus und zeigten, woher diese Moneykeyword-Links kamen. Eine ähnliche Abfrage machten wir nach den Vornamen: Man nehme eine Liste der ca. 50 wichtigsten Vornamen und suche die Websites, die in den letzten Tagen mit möglichst vielen verschiedenen Vornamen verlinkt wurden. Der Spitzenreiter dieser Liste war eine Finanzwebsite, die (innerhalb weniger Tage!) mit mindestens 24 verschiedenen Vornamen über Blogkommentare verlinkt worden war. Auch für diese Website zeigten wir die aktuell gesetzten Backlinks und konnten feststellen, dass dort sehr schlau gearbeitet wurde. Hätten wir nicht speziell die Vornamen aggregiert, die Linktexte hätten gut variiert auf uns gewirkt.

Da wir gerade im Finanzbereich waren, warfen wir einen kurzen Blick auf die aktuellen Backlinks einer anderen Website, die in den letzten Wochen durch einen deutlichen Verlust in den Sichtbarkeitsindizes im Gespräch war. Wir zeigten, dass dort Brand-Links und Moneykeyword-Links intensiv gemischt wurden.

Die nächste untersuchte Website war ein österreichischer Onlineshop, der uns aufgefallen war, weil mehrere Tage in Folge stets zur gleichen Zeit zwischen ca. 10:30 Uhr und 11:30 Uhr jeweils mehrere Artikel in Artikelverzeichnissen publiziert wurden, die allesamt mit Moneykeywords verlinkten. Außerhalb der o.g. Zeiten wurden keine Backlinks gesetzt. Eines der dort aufgefunden Keywords nahmen wir als Suchanfrage und betrachteten, welche anderen Websites aktuell mit diesem Keyword verlinkt werden.

Abschließend zeigten wir noch die Unterschiede in der tagesaktuellen Backlinkstruktur dreier SEO-Dienstleister, wobei wir mediadonis.net als Vergleichsbeispiel hatten um zu demonstrieren, wie natürliche Links in der zeitlichen Betrachtung aussehen.

Der Live-Teil dürfte knapp 25 Minuten gedauert haben; bei insgesamt dreizehn gezeigten Websites und Linktexten hatten wir also pro Website nicht mal zwei Minuten Zeit. Wer immer also gehört haben mag, wir hätten eine bestimmte Website auseinander genommen, ist ein Opfer der Stillen Post geworden.

Fazit

Wie SEO-United in ihrem (oben verlinkten) Post so schön dargestellt haben, waren unsere Tools extrem simpel im Vergleich zu dem, was Google zur Verfügung haben dürfte. Und schon mit diesen simplen Tools konnten wir Footprints zeigen, an die wir auch selbst zuvor nicht gedacht hatten. Man stelle sich nur eine Website mit 500 „natürlichen“ Links vor. Dort setzt man nun auf die Schnelle 100 Keywordlinks. Die klassischen Linktools zeigen dann immer noch eine sehr gesunde Backlinkstruktur an. Alles scheint im grünen Bereich. Doch auf der zeitlichen Schiene betrachtet, sieht die Sache plötzlich ganz anders aus.

Deshalb bleibt als Fazit: Footprints lauern überall!

PS: Wer das Tool nachbauen möchte, sollte sich vielleicht noch etwas gedulden. Uns hat bereits ein SEO-Tool-Anbieter angesprochen, dass er die Funktion in sein vorhandenes Backlink-Tool integrieren möchte.