13:34 Ha! Endlich kommt da mal Bewegung in diese völlig vergurkte #LSR-Sache: google-produkte.blogspot.de/2014/10/news-z… #Google #VGMedia #


14:37 Was wurde eigentlich aus der Kartellbeschwerde gegen Google? stefan-niggemeier.de/blog/18786/sch… #LSR #
dentaku, 14:24
Diese Woche tritt das unselige Leistungsschutzrecht für Presserverlage in Kraft. Es verbietet Suchmaschinen und Aggregatoren, (auch kleine) Ausschnitte aus Presseerzeugnissen ohne Genehmigung der Verlage wiederzugeben. Die Verlage hatten gehofft, damit von den großen Suchmaschinen Geld bekommen zu können. Doch Google hat es sich einfach gemacht, und lässt sich von den Verlagen eine zukünftige kostenlose Nutzung bestätigen — andernfalls würden ihre Webseiten nicht mehr in den Suchergebnissen auf Google News erscheinen. Ich gehe im Moment davon aus, dass kein Verlag — auch keiner der Befürworter des Leistungsschutzrechts — darauf verzichten möchte und dass daher alle zähneknirschend eingewilligt haben werden. Leider haben die anderen Aggregatoren keine so große Marktmacht, und so trifft das Gesetz jetzt den, für den es sich die Verlage gewünscht hatten am wenigsten.
Rivva lässt konsequenterweise die Snippets verschwinden. In den Kommentaren zu dem entsprechenden Artikel erklären jetzt massenweise Blogger und andere Seitenbetreiber ein explizites Opt-In. Das ist nett (und der Zuspruch wird Frank Westphal vermutlich auch freuen), aber wirklich nützlich ist es nur, wenn der Rivva-Bot ein solches Opt-In beim Lesen der Seite sehen kann. Auch auf den Gedanken bin ich natürlich nicht allein gekommen, und so tauchen — ebenfalls in den Kommentaren — bereits zwei unterschiedliche Implementierungen auf.
Felix Schwenzel (@diplix) schlägt
<meta name="rivva" content="Allow: *"/>
in der Seite vor, @herzi schlägt eine Erweiterung der robots.txt vor:
User-agent: Rivva X-allow-snippets: true
Das ganze kann nur wirklich funktionieren, wenn wir uns einigen, drum habe ich mir die Spezifikationen der beiden Methoden kurz angesehen und mache auf dieser Basis hier einen dritten Vorschlag. 😉
In Anlehnung an Googles nosnippet-Direktive würde ich in robots.txt und in den Robots-Meta-Tags eine snippet-Direktive einbauen. Das würde keinen der aktuellen Parser verwirren, denn sowohl in HTML-Meta-Tags als auch in robots.txt soll der Parser laut Spezifikation unbekannte Direktiven ignorieren. Das würde dann so aussehen:
<meta name="rivva" content="index,follow,snippet"/>
bzw.
user-agent: rivva allow: / snippet: /
Snippets könnten damit natürlich auch für weitere (oder alle) Crawler freigegeben werden. Was meint Ihr?
Und wichtiger: kann der Rivva-Bot so etwas (in absehbarer Zukunft) berücksichtigen?
13:15 @oliverg Da mediainfo.de/index/lsr-frei und da: dentaku.wazong.de/2013/03/01/lsrdnsbl/ #LSR #
09:44 @svensonsan Das ist (verkürzt) die Definition des Schutzgegenstands („Presseerzeugnis“) im §87f(2) des neuen #LSR #
16:28 @egghat @kaffeebeimir Als harmlos eingestuft: lsrbl.wazong.de/heise.de #heise #LSR #
dentaku, 14:32
Die DNS-Blacklist zum Leistungsschutzrecht wird weiter gepflegt:
Viel Spaß weiterhin.
20:51 Hallo @kaffeebeimir, darf ich die von Euch gesammelten #LSR -Whitelist-Daten mit in die #DNSBL aufnehmen? dentaku.wazong.de/2013/03/01/lsrdnsbl/ #
10:24 So, nochmal für die Tagschicht: ich habe eine technische Basis für #LSR -Sperren gebastelt: dentaku.wazong.de/2013/03/01/lsrdnsbl/ #
dentaku, 22:07
Jetzt ist es passiert: heute hat der Bundestag das Leistungsschutzrecht für Presseverleger verabschiedet. Damit ist es zwar noch nicht Gesetz, aber das könnte durchaus noch in dieser Legislaturperiode passieren. Die rechtlichen Unsicherheiten der aktuell beschlossenen Fassung sind groß. Da ist es eine nachvollziehbare Reaktion, auf die Befürworter des Leistungsschutzrechts nicht (mehr) verlinken zu wollen.
Dafür gibt es auch schon einige technische Lösungen, allen voran das WordPress-Plugin von D64. Wenn ich aber in den Sourcecode der verschiedenen Lösungen gucke, dann sehe ich entweder eine mitgelieferte Liste oder (wie bei D64) den Zugriff auf einen zentralen Server. Wenn der ausfällt, dann hängt z.B. ein Blog, auf dem ein solches Plugin aktiv ist.
Eine DNS Blacklist ist eine im Bereich der eMail-Spambekämpfung gut erprobte Methode zur Skalierung solcher Abfragen, deshalb habe ich jetzt aus der bestehenden Liste (von D64) eine solche erstellt — und bin dabei gleich noch einen Schritt weiter gegangen. Das neue Recht gilt nämlich eigentlich natürlich für alle Presseverlage, deshalb habe ich gleich eine mehrstufige Kategorisierung eingebaut.
Die Abfrage erfolgt über domain.tld.lsrbl.wazong.de
und liefert die folgenden Antworten:
dentaku@nyx:~$ host wazong.de.lsrbl.wazong.de wazong.de.lsrbl.wazong.de has address 127.0.0.0
dentaku@nyx:~$ host spiegel.de.lsrbl.wazong.de spiegel.de.lsrbl.wazong.de has address 127.0.0.1
dentaku@nyx:~$ host focus.de.lsrbl.wazong.de focus.de.lsrbl.wazong.de has address 127.0.0.2
Subdomains sind auch unterstützt:
dentaku@nyx:~$ host sonderaktion.sport.bild.de.lsrbl.wazong.de sonderaktion.sport.bild.de.lsrbl.wazong.de has address 127.0.0.2
Macht damit, was Ihr wollt und könnt. Viel Spaß!
(Teaserbild: CC-BY-SA von Digitale Gesellschaft)
Update 02.03.2013:
Nach Input von @moeffju habe ich die Rückgabewerte von 0.0.0.x auf 127.0.0.x geändert.
14:06 Hat jemand eine Domainliste (oder DNSBL oder …) der #LSR -Befürworter? Würde gern Maßnahmen ergreifen. #