Open Access – welche Rolle spielen offene Metadaten?

Damit wissenschaftliche Publikationen such- und auffindbar gemacht werden können, müssen sie mit Metadaten beschrieben werden. Gängige Metadaten eines Zeitschriftenartikels sind zum Beispiel der Titel, eindeutige Identifikatoren (zum Beispiel DOI), die Namen der Urheber:innen, der Name der Zeitschrift, in der er erschienen ist, und Angaben zu Seitenzahl und Erscheinungsjahr. Diese Metadaten sind wertvoll, denn sie ermöglichen es, Inhalte von Publikationen an verschiedenen Stellen auffindbar zu machen, miteinander zu verknüpfen und nachzunutzen. Umso wichtiger ist es, dass diese Metadaten schrankenlos zur Verfügung stehen, um einen weitestgehenden Zugriff auf wissenschaftliche Erkenntnisse zu ermöglichen.

Das Problem ist derzeit, dass kleine Verlage und Journals oft von großen Zitationsindizes (wie Web of Science, Scopus) ausgeschlossen sind, ebenso nicht-englischsprachige Literatur sowie Geistes- und Sozialwissenschaften. Um hier Abhilfe zu schaffen, sind aus der Wissenschaft heraus Initiativen wie die Initative for Open Citations oder die Initative for Open Abstracts entstanden. Und vor diesem Hintergrund entstand auch die Idee für das BMBF-geförderte Vorhaben OPTIMETA, das wir an der TIB gemeinsam mit dem Institut für Geoinformatik der Westfälischen Wilhelms-Universität Münster durchführen.

Wir möchten Open-Access-Zeitschriften dabei unterstützen, offene Metadaten in strukturierter und leicht nutzbarer Form zu veröffentlichen, damit die von ihnen publizierten Erkenntnisse eine möglichst hohe Sichtbarkeit erlangen – und somit der wissenschaftliche Erkenntnisprozess insgesamt effizienter, effektiver und partizipativer wird.

Da wir wissen, dass es für kleine Verlage am schwierigsten ist, Sichtbarkeit zu erlangen, sind wir zu dem Schluss gekommen, dass wir uns insbesondere (aber nicht nur) auf diese konzentrieren sollten. Unsere Plug-ins entwickeln wir für die Plattform Open Journal Systems (OJS), weil es sich hierbei um die am weitesten verbreitete Open-Source-Plattform zur Veröffentlichung von Zeitschriften handelt und weil OJS insbesondere von kleinen Verlagen genutzt wird. Zum Zeitpunkt der Erstellung dieses Artikels nutzen weltweit über 25.000 Zeitschriften diese Plattform.

Wir konzentrieren uns dabei auf zwei verschiedene Arten von Metadaten: Zitationsmetadaten und raumzeitliche Metadaten (Geodaten). Hier möchten wir über Zitationsmetadaten schreiben; auf das Thema raumzeitliche Metadaten werden wir in einem zukünftigen Blogposting eingehen.

Zitationsmetadaten

Zitate erfüllen mehrere wichtige Zwecke, zum Beispiel ermöglichen sie es den Lesenden, unabhängig festzustellen, ob das referenzierte Material die Argumente der Autorin bzw. des Autors unterstützt. Die Metadaten von Zitaten und ihrer Quellen nennt man Zitationsmetadaten oder Zitationsinformationen.

Unser Plug-in gibt Verlagen die Möglichkeit, die Referenzen in ihrer eigenen OJS-Instanz anzureichern. Das Hinzufügen und Bearbeiten von Verweisen wird innerhalb von OJS erfolgen.

Auszug aus dem Literaturverzeichnis einer Publikation
Auszug aus dem Literaturverzeichnis der OPTIMETA-Vorhabensbeschreibung

Dies wird während des Hinzufügens eines neuen Artikels oder später im Arbeitsablauf möglich sein. Darüber hinaus wird die OJS-Instanz des Herausgebers der zentrale Ort für die Verwaltung von Referenzen sein.

Für die Anreicherung der Referenzen sind verschiedene Methoden vorgesehen:

  • automatische Extraktion des Textfeldes für Referenzen in OJS
  • automatische Extraktion von Referenzen aus Druckfahnen
  • Nutzung externer Dienste für eine genauere Extraktion (PID, DOI, Autorenname, Titel usw.)
  • manuelle Bearbeitung einzelner Referenzen

Prinzipiell kommen für die Veröffentlichung von Zitaten alle Open-Access-Webseiten, wie Wikidata.org, OpenCitations.net (CROCI), Crossref.org und andere, infrage. Dies wird in späteren Versionen noch erweitert werden.

In einer zukünftigen Version werden wir auch einen Citation Manager hinzufügen. In diesem Citation Manager werden die Nutzer:innen von OJS alle Referenzen aller Artikel an einem Ort sehen können. Dies wird den Nutzer:innen einen genauen Überblick über alle Referenzen (aktuelle und vergangene Artikel) und deren Anmeldestatus geben.

Ausblick auf die nächsten Projektschritte

In Zusammenarbeit mit Verlagen und Zeitschriften erheben wir momentan die Anforderungen, die an unsere Plug-ins gestellt werden, damit wir sie möglichst praxistauglich umsetzen können. Anschließend wollen wir auch mögliche Autor:innen von Journalartikeln in unsere Bedarfsanalyse einbeziehen. Parallel entwickeln wir erste Prototypen unserer Plug-ins.

Konnten wir Sie neugierig machen? Dann freuen wir uns, wenn Sie unsere Projektwebseite besuchen, uns auf Twitter folgen und unsere Mailingliste abonnieren. Gerne treten wir mit Ihnen in den Dialog und freuen uns über Ihr Feedback.

Zur weiteren Anregung und Information ist beispielsweise die Aufzeichnung der Keynote „Unlocking Citations from tens Of millions of scholarly Papers“ der SWIB17 – Semantic Web in Libraries, die im AV-Portal der TIB zu finden sind. Darin wird anhand praktischer Beispiele gezeigt, wie die von der Initiative for Open Citations (I4OC) freigegebenen Daten wiederverwendet werden können, um wissenschaftliche Erkenntnisse zu beschleunigen und die Reichweite des wissenschaftlichen Wissens zu erhöhen:

Keynote der SWIB17 – Semantic Web in Libraries: Unlocking Citations from tens Of millions of scholarly Papers

Gazi Yücel arbeitet als Softwareentwickler im Open Science Lab der TIB an den Projekten OPTIMETA und TextTransfer II.

... arbeitet im Open Science Lab der TIB und beschäftigt sich dort (überwiegend) mit offenen Forschungsinformationen und Open Science. Weitere Informationen: https://tib.eu/christianhauschke