Experimente mit dem Canonical Meta-Tag

Bereits im Februar hat Google den Canonical Meta-Tag eingeführt. Zweck der Anweisung soll sein, das Duplicate Content-Problem zu lösen. Dazu fügt man im HEAD-Bereich der HTML-Seite eine Anweisung ein, die den Suchmaschinen (Google, Yahoo und Microsoft) mitteilt, dass die Originalversion dieser Seite womöglich unter eine anderen URL zu finden ist. Diese andere URL wird dabei natürlich ebenfalls angegeben. Der Canonical Meta-Tag sieht demnach dann so aus:

<link rel=“canonical“ href=“http://www.example.com/original/“ />

Soweit die langweilige Einführung zur Syntax des Canonical Tags. Spannend wird es, wenn der von URL-Umbauten genervte SEO hofft, sich – oder seinen noch mehr genervten Kunden – damit eine Konsolidierung der URLs ersparen zu können. Es soll Beratungsprojekte geben, in denen dem SEO bereits das Wort „Duplicate Content“ verboten wurde …

Zwar schreibt Google in seinem Webmaster Blog über den Canonical Meta-Tag:

It also helps to make sure that properties such as link popularity are consolidated to your preferred version.
(Er hilft auch zu gewährleisten, dass solche Größen wie etwa Link Popularity auf die bevorzugte Version übertragen werden.)

Allerdings glaube ich den Mitteilungen aus dem Hause Google erst dann, wenn ich die aufgestellten Behauptungen selbst experimentell überprüfen konnte. Also habe ich vor etlichen Wochen einen kleinen Versuch aufgebaut, um die genaue Wirkungsweise des Canonical Tag zu überprüfen. Dazu erstellte ich eine Kopie namens copy.html einer bereits existierenden Seite (original.html). Diese copy.html habe ich leicht verändert: Ich habe den Titel etwas modifiziert und einen kurzen Satz mit einem recht außergewöhnlichen Wort („WORT_A“) eingefügt; ebenso den entsprechenden Canonical Meta-Tag: <link rel=“canonical“ href=“original.html“>. Das Original wie die Kopie liegen auf der selben Domain. Um Googles Behauptung, der Canonical Tag würde „Link Juice“ weiterreichen, zu überprüfen, habe ich von einer fremden Domain einen Link auf die copy.html gesetzt. Der Linktext besteht dabei aus einem weiteren recht seltenen Wort: „WORT_B“. Das Szenario ist in dieser Grafik zusammengefasst:

Nachdem ich Google nun einige Wochen Zeit gelassen habe, meine Konstruktion entsprechend zu würdigen, bestätigt sich im Wesentlich das, was Google behauptet:

  • Die Seite copy.html wird von Google nicht aufgenommen.
  • WORT_A wird auf der Domain, auf der das Experiment durchgeführt wurde, nicht gefunden.
  • WORT_B hingegen wird gefunden – und zwar auf der Seite original.html.

Ganz offensichtlich „biegt“ der Canonical Meta-Tag den Link, der auf copy.html zeigt, auf die Originalseite um und weist den Linktext der original.html zu. Interessant ist auch noch ein kleiner Nebeneffekt: Die Website, auf der die Tests durchgeführt wurden, ist noch unter einer anderen Domain zu erreichen. Von dieser Spiegeldomain war bislang in Google nichts zu finden. Seit dem Experiment ist die copy.html unter der Spiegeldomain zu finden – auch bei einer Suche nach dem nur auf copy.html enthaltenen WORT_A. Anscheinend schließt Google die copy.html nur auf der Domain von einer Indexierung aus, auf der auch das Original liegt.

Was machen denn eigentlich die anderen Suchmaschinen? Yahoo nimmt „brav“ die copy.html auf und findet diese Seite sowohl unter WORT_A als auch unter WORT_B. Microsofts Live Search hingegen macht’s genau anders herum: Hier ist die copy.html überhaupt nicht zu finden, und die Versuchswebsite taucht weder für WORT_A noch für WORT_B auf. Es scheint so, als würde Yahoo den Canonical Metatag gar nicht beachten, während Microsoft das „canonical“ als „noindex“ interpretiert.

Natürlich ist mit dem Experiment noch nicht geklärt, ob durch das Umbiegen womöglich etwas Linkpower verloren geht. Ich würde das eigentlich erwarten. Trotzdem stimmt mich das Ergebnis bei Google zuversichtlich, dass manche Optimierungen großer Redaktionssysteme, die häufig extreme Duplicate-Content-Generatoren sind, mithilfe des Canonical Meta-Tag einfacher durchgeführt werden können.