Das Leistungsschutzrecht für Verleger und seine Auswirkung auf SEO

Das Leistungsschutzrecht für Presseverlage hat eine weitere Hürde genommen und wurde vom Rechtsausschuss des Bundestages befürwortet. Damit sieht es so aus, als würde die Bundestagsmehrheit aus Union und FDP dieses umstrittene Gesetz tatsächlich durchpeitschen. Vieles wurde zum Leistungsschutzrecht bereits geschrieben; ich möchte an dieser Stelle einmal darstellen, was die Umsetzung dieses Gesetzes fürs Suchmaschinenmarketing bedeuten könnte.

Auch wenn das Gesetz, dessen Details immer noch offen sind, unter dem Label „Leistungsschutzrecht“ diskutiert wird, so ist es doch letztlich ein Google-Kontroll-und-Abkassier-Gesetz. Die Zeitungsverleger geben das ja auch ganz offen zu, zetern sie doch bei jeder Diskussion um das neue Recht öffentlich über Googles angeblich so unfaires Geschäftsmodell. Schon daraus ergibt sich deutlich, dass das Leistungsschutzrecht für SEO wichtig sein dürfte.

Ich muss zugeben, ich habe die Strategie der Verlage lange nicht verstanden. Sie beschweren sich über Google News – doch alle machen dort freiwillig mit, niemand wird gezwungen. Wird die robots.txt-Datei erwähnt, weichen die Verlagsvertreter aus und reden wieder darüber, wie unfair Google doch sei. Eigentlich kam bei mir nur an, die Zeitungsverlage möchten ein Gesetz, das einfach nur das regelt, was sie ohnehin heute mit der robots.txt-Datei oder ein paar Meta-Tags erreichen könnten.

Dabei ist die Sache weitaus spannender. Natürlich weiß heute jeder Verlagschefs, dass es Möglichkeiten gibt, Google zu sagen, was indexiert werden soll und was nicht. Doch geht es ganz offensichtlich den Verlagen nicht ums Indexieren und auch nicht um Google News. Es geht ihnen um die absolute Kontrolle darüber, was Google in seinen Index aufnehmen und wie Google Verlagsergebnisse darstellen soll. Für diesen Wunsch wurde das robots.txt-Protokoll nicht erschaffen und kann das somit nicht leisten. Deshalb haben sich die Verlage eine Alternative zur robots.txt-Datei ausgedacht und verlangen nun im Zuge des Leistungsschutzrechts dieses neue Verfahren namens ACAPverbindlich festzulegen.

ACAP stellt eine Reihe von Verfahren dar, die letztlich eine erheblich Erweiterung des robots.txt-Protokolls sind; Erweiterungen, mit denen der Publisher einer Website der Suchmaschine bis ins Detail vorschreiben kann, wie diese Suchmaschine seine Website zu indexieren hat. Darunter sind Mechanismen, von denen sicherlich viele SEOs seit Jahren träumen – und die Google vollkommen zurecht als Einladung zur Manipulation zurückweist. Hierzu einige Beispiele, die meisten direkt entnommen aus der ACAP-Spezifikation. Ich hoffe, mit diesen Zitaten kein wie auch immer geartetes Leistungsschutzrecht zu verletzen.

ACAP-allow-index: /news/2007/ time-limit=until-2007-12-31

Diese Anweisung schreibt der Suchmaschine vor, alle indexierte Nachrichten aus dem Verzeichnis /news/2007/ nur bis zum 31.12.2007 im Index zu halten. Danach sind sie also zu deindexieren, letztlich also zu löschen.

ACAP-allow-index: /page-image.pdf must-use-resource=/page-image-index.txt

Diese Anweisung ist mein persönlicher Favorit. Mit must-use-resource schreibt der Publisher der Suchmaschine vor, dass sie die URL /page-image.pdf zu verlinken hat, dazu aber der Inhalt der URL /page-image-index.txt zu benutzen sei. Wer jetzt laut Cloaking schreit, hat diese Anweisung richtig verstanden. Auch die Entwickler von ACAP wissen das und schreiben in der Erläuterung dazu: „This qualification of the index usage type may be interpreted by some crawler operators as ‚cloaking‘.“ Da kämpfen die Suchmaschinen mit großem Aufwand – und absolut im Sinne der Nutzer – seit vielen Jahren gegen Cloaking und nun soll ein Gesetz verabschiedet werden, das sie zwingt eine Cloaking-Schnittstelle einzubauen. Die must-use-resource-Angabe kann laut Spezifikation auch eine absolute URL sein, mithin wäre es also auch möglich, externe Quellen anzuzapfen. Was für eine Arbeitserleichterung für Scraper! Sparen sie sich doch künftig das aufwändige und fehleranfällige Kopieren fremder Seiten, denn das muss künftig Google für sie übernehmen.

ACAP-allow-index: /articles/ must-use-resource=the-acap:extract:class:abstract

Doch die allow-index-Anweisung kann noch mehr. Es lässt sich im Detail angeben, welche Teilbereiche einer einzelnen Seite überhaupt indexiert werden dürfen. Im aufgeführten Beispiel wäre das nur der Inhalt aller HTML-Klassen mit dem Namen „abstract“.

ACAP-disallow-present-link: /article/

Fast schon von Valentinscher Komik ist die Anweisung present-link. Damit kann die Suchmaschine angewiesen werden, bestimmte gecrawlte und indexierte URLs nicht anzuzeigen. Weil ich diesen Befehl selbst fast nicht glauben kann, hier die Beschreibung aus der Spezifikation: „This usage type enables expression of a permission or prohibition to present a link to the crawled resource on the crawled site.“
Wer Google ärgern will, baut künftig also eine riesengroße Website, lässt dort alles indexieren, verbietet Google aber die Darstellung des Links.

ACAP-allow-present-currentcopy: /public/ prohibited-modification=style

Sie haben sich schon mal geärgert, dass Ihre typografisch fein gestaltete Website in Google so langweilig daherkommt? Nun, ACAP schafft hier Abhilfe. Mit prohibited-modification=style schreiben Sie der Suchmaschine vor, Ihre Typografie beizubehalten. Oder in den Worten der Spezifikation: „any typographic style or layout modification is prohibited“. Wenn ich also meine Seite mit Comic Sans verschönere, muss Google mein Snippet auch mit diesem wunderschönen Font präsentieren. Ganz nebenbei tut sich hier eine neue Verdienstmöglichkeit für Schriftsetzer auf.

ACAP-allow-present: /public/ must-include-link=/toller-artikel

Auch das dürfte sicherlich viele SEOs freuen: Künftig können wir Google anweisen, zusätzlich zum normalen Suchergebnis einen weiteren beliebigen Link einzublenden. Die einzige Voraussetzung dafür ist, dass dieser Link gecrawlt werden darf. Zeigt Google also künftig ein Suchergebnis von z.B. welt.de an, kann „Die Welt“ neben diesem Ergebnis einen Link zu einer anderen Axel-Springer-Website präsentieren. Noch nie war Cross-Promotion so einfach.

ACAP – die neue Google API

Mit ACAP haben sich die drei großen Zusammenschlüsse von Verlagen (World Association of Newspapers, European Publishers Council, International Publishers Association), die hinter der Initiative stehen, eine API gebastelt, mit der sie Google künftig weitgehend fernsteuern könnten. Letztlich fehlt nur noch eine Anweisung wie ACAP-force-ranking: http://example.com/ position=1, dann wäre das Feature-Set wirklich komplett.

So verrückt manche ACAP-Anweisungen auch klingen mögen, es ist beim derzeitigen Stand nicht ganz ausgeschlossen, dass sie durch das Leistungsschutzrecht eingeführt werden. Für uns wirft das die Frage auf, wie wir davon profitieren könnten? Nun, das zu beschließende Gesetz enthält kein Wort über ACAP. Die Umsetzung von ACAP könnte die Folge der Gesetzesänderung sein. Denn durch das geänderte Urheberrecht bekommen Presseverleger weitgehende Rechte und ACAP wäre der Mechanismus, diese Rechte automatisiert durchzusetzen. Wer also als Suchmaschinenoptimierer davon profitieren will, muss dafür sorgen, künftig unter den Geltungsbereich dieser Rechtsnorm zu fallen. Wie lässt sich das erreichen? Der Gesetzesentwurf vom 14.11.2012 definiert ein Presseerzeugnis so:

Ein Presseerzeugnis ist die redaktionell-technische Festlegung journalistischer Beiträge im Rahmen einer unter einem Titel auf beliebigen Trägern periodisch veröffentlichten Sammlung, die bei Würdigung der Gesamtumstände als überwiegend verlagstypisch anzusehen ist und die nicht überwiegend der Eigenwerbung dient. Journalistische Beiträge sind insbesondere Artikel und Abbildungen, die der Informationsvermittlung, Meinungsbildung oder Unterhaltung dienen.

Quelle: Deutscher Bundestag, Drucksache 17/11470, §87f (2)

Im Rahmen des aktuellen Content-ist-King-Hypes dürfte es nicht allzu schwer sein, SEO-getriebene Projekte so weit zu trimmen, dass sie unter diese Definition fallen und dann von all den schönen ACAP-Mechanismen profitieren können. Fast bin ich geneigt, den Zeitungsverlagen alles Gute für ihr Ansinnen zu wünschen …

Update: Martin hatte bereits im Herbst eine kleine Glosse zu den Vorteilen des Leistungsschutzrechts für SEOs geschrieben: Das goldene Zeitalter der Suchmaschinenoptimierung liegt vor uns …