Seit vielen Jahren hat Google einen Filter, der verhindern soll, Duplikate bereits vorhandener Seiten in den Index aufzunehmen. Dieser Duplicate Content-Filter ist eigentlich dafür gedacht, Spamsites, die Inhalte anderer Seiten übernehmen, nicht in Google auffindbar zu machen. Da es aber oft legitime Gründe für kopierte Seiten gibt, hat Google Anfang 2009 einen eigenen Tag dafür eingeführt:
<link rel=”canonical” href=”http://www.example.com/original/” />
Alle Seiten, deren Inhalte von einer anderen URL übernommen wurden, können mit diesem Tag im <head>-Bereich deutlich machen, dass das Original der Seite unter einer anderen (eben der angegebenen) URL zu finden ist. Während dieser Canonical Tag zunächst nur für Kopien innerhalb einer Domain zulässig war und domainübergreifende Angaben ignoriert wurden, ist sei Dezember 2009 auch die Angabe einer URL möglich, die auf eine andere Domain verweist.
Seiten, die den Canonical Tag enthalten, müssen nicht genaue Kopien der dort angegebenen Originalseite sein, sie sollten aber eine hohe Ähnlichkeit aufweisen. Außerdem macht Google deutlich, dass der Canonical Tag keine absolut gültige Anweisung wie etwa ein Noindex-Metatag ist, sondern nur ein Hinweis an die Suchmaschine, der unter Umständen auch ignoriert wird. Der Canonical Tag ist eine Erfindung von Google und wird von anderen Suchmaschinen entweder gar nicht oder nur teilweise unterstützt. Es ist deshalb für jeden SEO empfehlenswert, Duplicate Content so weit es geht zu vermeiden und nur dann auf den Canonical Tag zurückzugreifen, wenn eine andere Lösung nicht machbar ist.
Details zur Funktionsweise des Canonical Tag sind durch ein kleines Experiment in diesem Artikel beschrieben:
Experimente mit dem Canonical Meta-Tag