Datentracking – nicht bei uns

Wer sich im Internet bewegt, hinterlässt Spuren. Das Sammeln, Auswerten und Verkaufen dieser Daten ist für viele Firmen eine Goldgrube, der Datenschutz bleibt dabei oft auf der Strecke. „Wenn du nicht für das Produkt bezahlst, bist du das Produkt“ wurde zur pointierten Beschreibung des Geschäftsmodells von Facebook, Google & Co. In letzter Zeit sind jedoch Firmen in den Fokus gerückt, die ihre Dienste keineswegs kostenlos zur Verfügung stellen, sondern sich dafür ohnehin schon gut bezahlen lassen. Großverlage wie Elsevier oder Springer Nature, die mit wissenschaftlichen Zeitschriften über Subskriptionen oder Open-Access-Gebühren gut verdienen, haben die Möglichkeiten der Datenaggregation für sich entdeckt und entwickeln sich – auch in der Selbstdarstellung – zu Data Analytics Businesses.

Im Oktober 2021 veröffentlichte der Ausschuss für Wissenschaftliche Bibliotheken und Informationssysteme der Deutschen Forschungsgemeinschaft (DFG) ein Informationspapier, das die Methoden der Verlage ausführlich beschreibt. So werden Technologien eingesetzt, die erlauben, die Daten von Forschenden wie personalisierte Profile, Zugriffs und Nutzungsdaten, Verweildauern bei Informationsquellen bis hin zur Tippgeschwindigkeit zu erfassen, zu speichern und miteinander zu verknüpfen. Das geschieht nicht nur auf den Verlagsseiten, sondern auch über zusätzliche Software, die Bibliotheken angeboten wird und als Trojaner“ fungiert. Da die großen Verlage neben dem eigentlichen Verlagsgeschäft zahlreiche zusätzliche Dienste, etwa Literaturverwaltungsprogramme oder Forschungsinformationssysteme anbieten, können Nutzer:innen an vielen Stellen ihrer wissenschaftlichen Tätigkeit getrackt werden. Die Verlage sind diesbezüglich wenig transparent und informieren die Nutzer:innen im Hinblick auf die in Europa geltenden Anforderungen der Datenschutz-Grundverordnung (DSGVO) oft nur unzureichend. Tests haben gezeigt, dass beispielsweise beim Lesen eines Nature-Artikels rund 70 verschiedene Analyse- und Profiling-Tools sowohl des Verlags als auch von Dritten im Hintergrund Daten sammeln.

Die Verlage begründen den Einsatz mit dem Vorgehen gegen Schattenbibliotheken wie Sci-Hub. Für die Wissenschaft ist das jedoch höchst problematisch. Die Nachverfolgung der Forschenden kann der Wissenschaftsfreiheit und der informationellen Selbstbestimmung widersprechen und ebnet unter Umständen den Weg für Datenmissbrauch durch Spionage oder Diskriminierung. Es führt zu einer weiteren Monopolisierung und Privatisierung der Wissensgesellschaft, indem Wissen über Forschungsinhalte und -tendenzen zunehmend in privater Hand liegen.

Natürlich können Daten über wissenschaftliche Aktivitäten auch nützlich für die Wissenschaft selbst sein. Hierfür braucht es aber klare und transparente Regeln zur Datengewinnung, Datennutzung und Datenweitergabe und Möglichkeit der Nutzung zu nicht-kommerziellen Zwecken. Am besten ist das aus unserer Sicht sichergestellt, wenn die Publikationsinfrastruktur nicht in den Händen weniger Großverlage, sondern wieder mehr in den Händen der Wissenschaft liegt und Daten, die aus dem gesamten Forschungsprozess stammen, der Allgemeinheit gehören, wie es in den Principles of Open Scholarly Infrastructure verlangt wird.

Publikationsplattformen der TIB

Die von der TIB betriebenen Publikationsplattformen – TIB Open Publishing für Konferenzpublikationen und Zeitschriften, das TIB AV-Portal für wissenschaftliche Videos, das Institutionelle Repositorium der Leibniz Universität Hannover und Renate, das Repositorium für Naturwissenschaften und Technik verarbeiten personenbezogene Daten im Einklang mit der DSGVO. Sie setzen nur technisch notwendige Cookies, IP-Adressen werden anonymisiert. Es werden nicht unnötig Daten erhoben, geschweige denn die Nutzenden aus kommerziellen Interessen durchleuchtet. Genaue Informationen über Cookies, Webanalyse-Tools und Opt-Out-Optionen finden sich in der allgemeinen Datenschutzerklärung auf der Webseite über die die jeweilige Dienstleistung angeboten wird.

B!SON

Auch B!SON kommt vollständig ohne User tracking aus: B!SON ist ein Empfehlungstool für Open-Access-Journals, das die TIB aktuell im Rahmen eines BMBF-Projekts gemeinsam mit der SLUB Dresden entwickelt. Es nutzt Bestandteile eines Manuskripts (Titel, Abstract, Referenzen), um Nutzer:innen inhaltlich zu ihren Forschungsergebnissen passende Publikationsorte zu empfehlen. Zudem können Nutzer:innen über eine Filterfunktion bei Bedarf B!SON eigene Auswahlkriterien übermitteln, um die durch semantische und bibliometrische Ähnlichkeit generierten Empfehlungen weiter einzugrenzen. Darüber hinaus werden lediglich anonymisierte IP-Adressen gespeichert, um einfache Nutzungsanalysen durchführen zu können. All diese Informationen sind nicht personenbezogen.

B!SON nutzt für die Empfehlungen ausschließlich frei verfügbare Datenkorpora – die des Directory of Open Access Journals sowie von OpenCitations. Zudem wird der Quellcode unter einer freien Lizenz zur Verfügung stehen. Damit stellen wir B!SON gemäß den Prinzipien offener wissenschaftlicher Infrastrukturen (POSI) bereit – diese schließen Modelle, die kommerzielle Wertschöpfung aufgrund von Daten generieren, aus: „Data related to the running of the research enterprise should be a community property.“ Mit der Betonung von Datenschutz und Offenheit grenzt sich B!SON zu den Journalfinder-Angeboten anderer (kommerzieller) Anbieter ab.

KOALA

Das gemeinsam mit dem Kommunikations-, Informations-, Medienzentrum (KIM) der Universität Konstanz durchgeführte Projekt KOALA – Konsortiale Open-Access-Lösungen aufbauen hat zum Ziel, alternative Finanzierungsmodelle für Open-Access-Publikationen zu entwickeln, bei denen die Autor:innen keine Kosten tragen müssen. Die Zeitschriften und Schriftenreihen werden stattdessen von Konsortien aus Hochschulbibliotheken und anderen Einrichtungen finanziert. Der Verzicht auf Datentracking ist eine der Voraussetzungen, dass Zeitschriften und Schriftenreihen über KOALA finanziert werden können. In den Anforderung an die Mindeststandards heißt es: „Die verwendeten technischen Systeme dürfen keine Daten zum Nutzungsverhalten erheben, die über das technisch Notwendige hinausgehen. Die erhobenen Daten müssen den geltenden Verordnungen (z. B. DSGVO) entsprechend in einer Datenschutzerklärung beschrieben werden.“

Nicht nur während der Love Data Week beraten wir Wissenschaftler:innen – in ihrer Rolle als Autor:innen, Leser:innen oder als Herausgeber:innen – zu Optionen des trackingfreien Publizierens und Lesens. Wenden Sie sich gerne an publikationsberatung@tib.eu.

Was ist Ihre Meinung zu Datentracking, wie wichtig ist Ihnen datenschutzkonformes Publizieren? Wir freuen uns über Kommentare unter diesem Blogpost!

Weiterführende Informationen und Positionen zum Thema Datentracking in der Wissenschaft finden sich etwa im TIB AV-Portal mit zwei einschlägigen Videos.

Aufzeichnung des Vortrags „Tracking in der Wissenschaft: Folgen für Datenschutz und Wissenschaftsfreiheit“ von Felix Reda bei der #vBIB21:

Aufzeichnung der Podiumsdiskussion „Wenn du nicht für das Produkt bezahlst, bist du selbst das Produkt?“, gemeinsam veranstaltet vom Open-Access-Büro Berlin und Wikimedia Deutschland:

Für Hinweise und Beiträge danken wir Elke Brehm (Datenschutzbeauftragte der TIB), Sarah Dellmann, Corinna Schneider und Matti Stöhr.

... arbeitet im Bereich Publikationsdienste der TIB und ist insbesondere für Beratung und Schulungen zum Thema Open Access zuständig.

... arbeitet im Bereich Publikationsdienste und betreut dort die Open-Access-Publikationsplattform TIB Open Publishing.

... ist Mitarbeiterin im Bereich Publikationsdienste der TIB und dort im Projekt B!SON tätig.