DataCite Metadatenschema Version 4.4 veröffentlicht

Version  4.4 hört sich vielleicht nicht nach einem großen Versions-Schritt an, bringt aber Veränderungen mit sich, auf die viele Einrichtungen (auch aus Deutschland) lange gewartet haben: ein kontrolliertes Vokabular für Textpublikationstypen.

Interessierten Metadaten-Expert:innen wird die Öffnung hin zu textuellen Publikationen beim Lesen des Titels der Schema-Dokumentation auffallen. Dieser lautete in der letzten Version 4.3 noch “DataCite Metadata Schema for the Publication and Citation of Research Data” und wurde wegweisend ergänzt zu:

“DataCite Metadata Schema Documentation for the Publication and Citation of Research Data and Other Research Outputs”

Die Liste der kontrollierten Werte von resourceTypeGeneral wurde nicht nur um textbasierte Publikationen erweitert, sondern auch um neue Publikationsformen wie “Preprint”, “ComputationalNotebook” oder “OutputManagementPlan”. Somit wurde nicht nur bestehenden Texpublikationstypen wie z. B. “JournalArticle”, “Book” und “Dissertation” berücksichtigt, sondern das Metadatenschema auch fit für die Zukunft gemacht.

Hier die Liste der neu hinzugefügten kontrollierten Werte für das Element resourceTypeGeneral:

  • Book
  • BookChapter
  • ComputationalNotebook
  • ConferencePaper
  • ConferenceProceeding
  • Dissertation
  • Journal
  • JournalArticle
  • OutputManagementPlan
  • PeerReview
  • Preprint
  • Report
  • Standard

Bei den klassischen Publikationsformaten haben wir das Rad nicht neu erfunden, sondern sind den Weg der gemeinsamen Standards gegangen und haben sie aus dem Vokabular von Crossref übernommen, was es für alle Anwender:innen beider Metadatenschemata einfacher macht.

Im Folgenden werden ausgewählte Publikationstypen erläutert:

  • Die neuen Werte: Journal, Book und Proceeding sind “Container” und werden für den neuen relationType “isPublishedIn” benötigt. Und wenn wir gerade bei “isPublishedIn” sind; dieser relationType kann in dem ebenfalls neuen Element “relatedItem” angegeben werden. “relatedItem” wurde hinzugefügt, um analoge Publikationen, die aus einer Zeit vor Persistent Identifiern stammen, dennoch in Verbindung mit dem registrierten Werk setzen zu können. Dazu gehört dann konsequenterweise auch, dass Sub-Elemente wie Volume, Issue, Page Numbers angegeben werden können (obwohl Seitenzahlen bei Online-Publikationen zu den bedrohten Metadaten-Arten gehört). Die Referenzierung von analogen Quellen (z. B. Buch und Buchkapitel) ist ein Use Case, der mit dieser neuen Metadatenschemaversion vor allem auch die Digital Humanities berücksichtigt.
  • Darüber hinaus wurden mit den neuen textuellen Publikationstypen im DataCite Metadatenschema resourceTypes für die Grüne Open-Access-Welt geschaffen, die somit endlich ihre Werke diversifizierter als bisher nur mit “text” angeben können. Dies betrifft einen nicht unerheblichen Teil von ca. 6,5 Mio. der knapp 23 Mio. Werke, die bei DataCite mit einem DOI versehen sind.
  • Ein spezielles, aber dennoch sehr konkretes Beispiel sind Dissertationen, die nun ebenfalls einen eigenen resourceType bekommen haben. Mit jeder neuen Version des DataCite Metadatenschemas geht die Herausforderung der Umsetzung für die Anwender:innen einher. Ein möglicher und relativ einfacher Ansatz wäre eine automatisierte Aktualisierung aller Dokumente eines Dissertations-Servers, mit der auf einmal tausende Dissertationen im bulk edit den resourceType bekämen, den sie verdienen.
  • Neben den textuellen Publikationstypen wird das neue Metadatenschema dem Alltag vieler Wissenschaftler:innen gerecht, wenn es um Data Management Pläne und Computational Notebooks (derer es von Jupyter unzählige gibt) geht.
  • Die neuen resourceTypes Conference Paper und Conference Proceeding bereiten die Integration eines PIDs für Konferenzen in eine zukünftige Version des Metadatenschemas vor. Dadurch werden Initiativen wie das DFG-geförderte Projekt ConfIdent vorausschauend aufgegriffen.

Insgesamt kommt das diversifiertere resourceType-Element nicht nur den Anwender:innen des DataCite-Metadatenschemas zu Gute, sondern wird auch im PID-Graph und somit auch in Open-Science-Services, wie DataCite Commons und ORCID etc. sichtbar. In letzter Konsequenz profitieren die Forschenden, deren Werke besser gefunden werden.

Für die Dokumentation des DataCite-Metadatenschemas siehe:

DataCite Metadata Working Group. (2021). DataCite Metadata Schema Documentation for the Publication and Citation of Research Data and Other Research Outputs. Version 4.4. DataCite e.V. https://doi.org/10.14454/3w3z-sa82

Autoren

Martin Fenner und Paul Vierkant arbeiten beide für DataCite.

Zitiervorschlag

Fenner, Martin, and Paul Vierkant. „DataCite Metadatenschema Version 4.4 Veröffentlicht.” Blog der DINI AGs FIS & EPUB, 2021. https://doi.org/10.57689/DINI-BLOG.20210507.


Dieser Beitrag ausgenommen Zitate und anderweitig gekennzeichnete Teile ist lizenziert unter der Creative Commons Namensnennung 4.0 International Lizenz (CC BY 4.0).
Creative Commons Lizenzvertrag


Über Gastautor(en)

Für einige Beträge können wir Gastautorinnen und Gastautoren gewinnen. Die Namen der Autorinnen und Autoren befinden sich in diesem Fall direkt unter dem jeweiligen Beitrag.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.