Kategorien
Blog

Wir wollen von Rivva gelesen werden

Diese Woche tritt das unselige Leistungsschutzrecht für Presserverlage in Kraft. Es verbietet Suchmaschinen und Aggregatoren, (auch kleine) Ausschnitte aus Presseerzeugnissen ohne Genehmigung der Verlage wiederzugeben. Die Verlage hatten gehofft, damit von den großen Suchmaschinen Geld bekommen zu können. Doch Google hat es sich einfach gemacht, und lässt sich von den Verlagen eine zukünftige kostenlose Nutzung bestätigen — andernfalls würden ihre Webseiten nicht mehr in den Suchergebnissen auf Google News erscheinen. Ich gehe im Moment davon aus, dass kein Verlag — auch keiner der Befürworter des Leistungsschutzrechts — darauf verzichten möchte und dass daher alle zähneknirschend eingewilligt haben werden. Leider haben die anderen Aggregatoren keine so große Marktmacht, und so trifft das Gesetz jetzt den, für den es sich die Verlage gewünscht hatten am wenigsten.

Rivva lässt konsequenterweise die Snippets verschwinden. In den Kommentaren zu dem entsprechenden Artikel erklären jetzt massenweise Blogger und andere Seitenbetreiber ein explizites Opt-In. Das ist nett (und der Zuspruch wird Frank Westphal vermutlich auch freuen), aber wirklich nützlich ist es nur, wenn der Rivva-Bot ein solches Opt-In beim Lesen der Seite sehen kann. Auch auf den Gedanken bin ich natürlich nicht allein gekommen, und so tauchen — ebenfalls in den Kommentaren — bereits zwei unterschiedliche Implementierungen auf.

Felix Schwenzel (@diplix) schlägt


<meta name="rivva" content="Allow: *"/>

in der Seite vor, @herzi schlägt eine Erweiterung der robots.txt vor:


User-agent: Rivva
X-allow-snippets: true

Das ganze kann nur wirklich funktionieren, wenn wir uns einigen, drum habe ich mir die Spezifikationen der beiden Methoden kurz angesehen und mache auf dieser Basis hier einen dritten Vorschlag. 😉

Vorschlag:

In Anlehnung an Googles nosnippet-Direktive würde ich in robots.txt und in den Robots-Meta-Tags eine snippet-Direktive einbauen. Das würde keinen der aktuellen Parser verwirren, denn sowohl in HTML-Meta-Tags als auch in robots.txt soll der Parser laut Spezifikation unbekannte Direktiven ignorieren. Das würde dann so aussehen:

<meta name="rivva" content="index,follow,snippet"/>

bzw.


user-agent: rivva
allow: /
snippet: /

Snippets könnten damit natürlich auch für weitere (oder alle) Crawler freigegeben werden. Was meint Ihr?

Und wichtiger: kann der Rivva-Bot so etwas (in absehbarer Zukunft) berücksichtigen?

Von dentaku

Site Reliability Engineer, Internet-Ureinwohner, Infrastrukturbetreiber, halb 23-Nerd halb 42-Nerd, links, gesichtsblind.

Schreibt mit "obwaltendem selbstironischem Blick auf alles Expertentum" (Süddeutsche Zeitung)

9 Antworten auf „Wir wollen von Rivva gelesen werden“

[…] habe Eure Vorschläge zur maschinenlesbaren Auszeichnung für @Rivva mal zu einem zusammengeführt: dentaku.wazong.de/2013/07/29/w…en-werden/  #  Microblog     […]

[…] nicht vor. Aber falls doch, dann sowie bisher – und deswegen untersütze ich Thomas’ Vorschlag. Lesen. Machen. […]

ix sagt:

wunderbar. <meta name=“rivva“ content=“index,follow,snippet“/> hatte ich auch in erwägung gezogen, ich fand aber so schön symbolisch rivva eine wildcard zu geben, auch wenn die syntaktisch fragwürdig war.

auch schön an so ner meta-anweisung, die kann man mit nem (wahrscheinlich) 15-zeiligen wordpressplugin umsetzen.

Ich möchte auch von Rivva gelesen werden, verstehe aber von dem, was Du da schreibst, ungefähr kein Wort. Gibt es eine Übersetzung für Technik-Analphabeten? Oder reicht es, wenn meine Webmistress das versteht? Oder muss ich vielleicht sogar gar nichts machen?

dentaku sagt:

Wenn wir uns alle untereinander und mit Rivva auf eine Syntax geeinigt haben, dann wird das Deine Webmistress mit wenigen Zeilen Code oder einem Plugin wie Add-Meta-Tags oder wpSEO einfügen können.

Oliver sagt:

Gerne! Aber doch bitte kein Meta-Tag, der genau für Rivva gedacht ist. Bitte einen generischen ausdenken.

dentaku sagt:

Das ist kein spezielles Rivva-Tag sondern wird von der Robots-Meta-Tag-Syntax abgedeckt (siehe verlinkte Spezifikation). Aber wenn Dir das besser gefällt, dann schreib bei Dir:

<meta name="robots" content="index,follow,snippet"/>

Super, danke – finde ich schön sauber gelöst.

Im Augenblick sehe ich jedoch schwarz für die Snippets, s. http://blog.rivva.de/rivva_und_das_leistungsschutzrecht_2#c8196

(Es macht mich auch zutiefst traurig, die snippet-Direktive als Innovation aus Deutschland zu akzeptieren 😉

[…] Ich weiß zwar, dass die taz das Leistungsschutzrecht nicht unterstützt hat, aber zwischen der Meinung der Redaktion und dem tatsächlichen Verhalten des Verlages können Welten liegen. Bleibt die Frage: Welche Verlage erlauben noch weiterhin eine solche Nutzung? Ich hätte mir die Anfrage bei der taz sparen können: Es existiert tatsächlich eine solche Whitelist – sie ist klein aber fein. Dienste wie Rivva könnten sie u.U. eine große Hilfe sein – es macht schließlich einen großen Unterschied, ob man dort mit oder ohne Snippet aufgeführt wird. Vermutlich ist das für Rivva zuviel Aufwand, aber es gibt ja noch die Idee, das per Meta-Tag im HTML-Code zu automatisieren. […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert