Open Citations: Zitationen frei verfügbar machen

Open Access, Open Source, Open Data, …und jetzt auch noch Open Citations? Was wie ein kleines Detail klingt, ist für die Wissenschaft äußerst wichtig. Die Quellen für alle zugrunde liegenden Aussagen, Daten und Methoden zu nennen, ist einer der Grundpfeiler wissenschaftlichen Arbeitens. „Veröffentlichungen sollen […] eigene und fremde Vorarbeiten vollständig und korrekt nachweisen (Zitate)“ heißt es beispielsweise in den Empfehlungen der Deutschen Forschungsgemeinschaft zur Sicherung guter wissenschaftlicher Praxis. Zitate erlauben es den Leser/innen, Informationen nachzuprüfen, Argumentationen nachzuvollziehen und Arbeiten in einen größeren Rahmen einzuordnen. Daneben spielen Zitate eine wichtige Rolle bei der Bewertung von Wissenschaft und Wissenschaftler/innen. Vereinfacht gesagt: Was bzw. wer wichtig ist, wird häufiger zitiert. Zahlen wie der Impact factor für Zeitschriften, der Hirsch-Index für Forscher/innen und andere bibliometrische Maße beruhen auf der Zahl der Zitationen. (Dass solche Maße durchaus kritisch zu sehen sind, steht auf einem anderen Blatt.)

Bis vor kurzem war nur rund 1 % der Zitationsdaten frei verfügbar, zuverlässige Daten waren nur über kostenpflichtige Datenbanken wie Web of Science und Scopus erhältlich. Zwar melden die Verlage ihre Daten an die im Jahr 2000 dafür geschaffene Non-Profit-Organisation Crossref, diese kann die Daten aber nur mit der expliziten Zustimmung des Verlags frei zugänglich machen. Um diesem Missstand abzuhelfen, haben sich mehrere Organisationen, darunter DataCite, PLOS und Wikimedia, zur Initiative for Open Citations (I4OC) zusammengeschlossen. Ein weiteres Problem neben der fehlenden Zugänglichkeit ist, dass die Daten auf Crossref unstrukturierte Rohdaten sind, die nur mit entsprechenden Kenntnissen und Aufwand analysiert werden können. Auch das soll im Rahmen der Initiative geändert werden, so dass die Zitationsdaten offen, strukturiert und getrennt von den (oft weiterhin kostenpflichtigen) Arbeiten zugänglich sind. Im Open Citations Corpus werden diese Daten gesammelt und unter einer CC0-Lizenz zur Verfügung gestellt.

Solcherart aufbereitete Daten erlauben zahlreiche Möglichkeiten der manuellen und automatischen Nachnutzung, die weit über Zitationsanalysen für einzelne Personen oder Zeitschriften hinausgehen. So lassen sich beispielsweise Verbindungen zwischen Forschungsgebieten aufdecken, die ansonsten verborgen blieben, es lässt sich nachvollziehen, wie sich wissenschaftliche Ideen in Raum und Zeit durch Zitate verbreiten oder der Einfluss bestimmter Artikel nachverfolgen. Auch Zitierkartelle können sich so aufdecken und darstellen lassen.

Mittlerweile wird I4OC von zahlreichen Organisationen und Wissenschaftsverlagen, darunter auch so gewichtigen wie Springer Nature, Wiley und Taylor & Francis, unterstützt. Bis März 2017 waren so bereits rund 40 % der Zitationen frei verfügbar. Das Ziel sind 100 % offene und leicht weiterverwendbare Daten. Es bleibt abzuwarten, ob auch bislang fehlende und nicht unbedingt für ihre Offenheit bekannte Verlage wie Elsevier (für rund 30 % der Daten in Crossref verantwortlich) für die Initiative gewonnen werden können.

... arbeitet im Bereich Publikationsdienste der TIB und ist insbesondere für Beratung und Schulungen zum Thema Open Access zuständig.