Wie wird das Registry of Research Data Repositories re3data verwendet und referenziert? – Eine kurze Literaturanalyse

Als globales Verzeichnis beschreibt re3data Forschungsdatenrepositorien aus allen wissenschaftlichen Disziplinen. Es listet Repositorien auf, die Forschenden, Förderorganisationen, Verlagen und wissenschaftlichen Einrichtungen die dauerhafte Speicherung von Forschungsdaten ermöglichen und den Zugang zu Datensätzen gewährleisten. Das Register ist seit Herbst 2012 online und wurde mehrfach von der Deutschen Forschungsgemeinschaft (DFG) gefördert. Im März 2013 wurden die beiden Verzeichnisse re3data und Databib zu einem Dienst zusammengelegt, der seit Ende 2015 unter der Schirmherrschaft von DataCite geführt wird. Seitdem hat das internationale Team erfahrener Editorinnen und Editoren mehr als 2600 Forschungsdatenrepositorien auf Basis eines umfassenden Metadatenschemas indexiert, welches momentan weiterentwickelt und verbessert wird.

Die Deutsche Forschungsgemeinschaft (DFG) fördert seit Januar 2020 das Projekt „re3data COREF (Community Driven Open Reference for Research Data Repositories)“ über einen Zeitraum von 36 Monaten. Ziel des Projekts ist es, re3data weiter auszubauen und als Referenz für Forschungsdatenrepositorien mit anderen Diensten und Infrastrukturen noch stäker zu vernetzen.

re3data ist als Hilfsmittel für Forschende konzipiert, die ein geeignetes Repositorium zur Veröffentlichung ihrer Daten suchen. Die zu jedem Repositorium hinterlegten Metadaten können darüber hinaus für andere Zwecke genutzt werden, zum Beispiel als Datenquelle für das Monitoring und die Analyse der Landschaft an Forschungsdatenrepositorien.

In diesem Blogbeitrag untersuchen wir, wie re3data derzeit in der wissenschaftlichen Literatur referenziert wird und beleuchten verschiedene Nutzungsmöglichkeiten des Services.

Wie wird re3data in der Literatur referenziert?

Für die Analyse wurden Dokumente ausgewählt, die re3data erwähnen bzw. darauf verweisen. Diese Dokumente wurden durch das kontinuierliche Monitoring verschiedener Quellen identifiziert, darunter die bibliographischen Datenbanken Scopus, Web of Science und Google Scholar. Die Referenzen wurden in Zotero verwaltet und annotiert. Mit Stand vom 5. März 2021 umfasste die Zotero-Bibliothek insgesamt 1571 Dokumente (hier verfügbar).

Ergebnisse

Unseren Daten zufolge wird re3data in Dokumenten auf mindestens 25 Sprachen erwähnt. Dies zeigt, dass der Dienst nicht nur Repositorien weltweit verzeichnet, sondern auch global referenziert und genutzt wird. Informationen über die verwendeten Sprachen sind für 913 Dokumente in der Sammlung verfügbar.

Die Sammlung umfasst verschiedene Dokumenttypen, welche auf BibTex-Dokumenttypen basieren. Insgesamt sind 9 Dokumenttypen in der Sammlung vorhanden. Abbildung 1 zeigt die Anzahl der Dokumente mit Erwähnung von re3data pro Publikationsjahr (kumulativ), aufgeteilt nach Dokumententyp (1524 Dokumente, ohne die im Jahr 2021 hinzugekommenen Dokumente). In der Grafik wird deutlich, dass die Anzahl der Veröffentlichungen kontinuierlich ansteigt. Zum einen deckt sich diese Beobachtung mit wachsenden Publikationsraten im Allgemeinen, sie weist jedoch auch auf ein zunehmendes Interesse und eine kontinuierliche Nutzung von re3data hin. Zeitschriftenartikel (567) und die Kategorie “Sonstiges” (551; darunter fallen z. B. Policies von Journals oder anderen Einrichtungen, Poster und Präsentationsfolien) sind die häufigsten Dokumenttypen. Das Publikationsjahr 2021 ist in dieser Darstellung nicht berücksichtigt. In diesem Jahr wurden jedoch bereits diverse neue Dokumente, die re3data erwähnen und auf seine Nutzung verweisen, in die Sammlung aufgenommen.

Abbildung 1: Anzahl der Dokumente, die re3data erwähnen pro Publikationsjahr (kumulativ), aufgeteilt nach Dokumententyp (ohne 2021)

Die Dokumente in der Zotero-Sammlung wurden allesamt manuell indexiert. Schlüsselwörter ergänzen die Beschreibungen und weisen zum Beispiel darauf hin, ob Mitglieder des re3data-Teams an einer Publikation beteiligt waren. Abbildung 2 zeigt die Entwicklung der Publikationszahl (567 Dokumente) über die Zeit, aufgeteilt nach Beteiligung des re3data-Teams.

Insgesamt wurden die meisten Artikel ohne Beteiligung des re3data-Teams veröffentlicht. Dies zeigt, dass re3data über den reinen Dienstbetrieb hinaus von Nutzen ist und in vergleichsweise großem Umfang von anderen Personen der wissenschaftlichen Community wahrgenommen oder sogar nachgenutzt wird.

Abbildung 2: die Anzahl der Zeitschriftenartikel pro Publikationsjahr (kumulativ), mit und ohne Beteiligung des re3data-Teams (ohne 2021)

Die Schlüsselwörter zeigen auch an, ob ein Dokument auf einen re3data-Eintrag verweist. Insgesamt verweisen 59 Dokumente mit re3data auf 44 Repositorien, z. B. in Aussagen zur Datenverfügbarkeit. Dies zeigt, dass es zwar einen Bedarf gibt, dauerhaft und eindeutig auf Forschungsdaten-Repositorien zu verweisen, dies aber erst vereinzelt praktiziert wird – jedenfalls soweit unsere Datensammlung dies abbildet.

Wie wird re3data verwendet?

Die bibliographische Analyse verdeutlicht, dass re3data für verschiedene Zwecke genutzt und referenziert wird. Folgende Anwendungsfälle sind nach unserer Wahrnehmung besonders verbreitet:

Forschungsdatenrepositorien suchen und finden

re3data wird genutzt, um ein geeignetes Repositorium zur Archivierung und Publikation von Datensätzen zu finden oder für die Recherche nach passenden Daten für die eigene Forschung. re3data bietet eine Web-Oberfläche, auf der Repositorien mit Hilfe von Kategorien und Schlüsselwörtern gesucht und Suchergebnisse nach den Eigenschaften der Repositorien gefiltert werden können. Andere Optionen bieten die Suche, nach Forschungsbereich, Content Type oder Heimatland der für eine Infrastruktur verantwortlichen Institution zu suchen.

Forschungsdatenrepositorien referenzieren und zitieren

re3data wird auch verwendet, um dauerhaft und eindeutig auf den Datensatz eines Repositoriums zu verweisen, zum Beispiel in Data Availability bzw. Data Access Statements. Unter jedem re3data-Eintrag finden sich ein Vorschlag für die Zitierung desselben. Zur eindeutigen Identifikation empfehlen wir die Verwendung des Digital Object Identifiers (DOI), den re3data für diese Datensätze vergibt.

Analyse und Monitoring

Die von re3data bereitgestellten detaillierten Beschreibungen eignen sich, um bestimmte Eigenschaften von Repositorien oder die Forschungsinfrastrukturlandschaft insgesamt zu beobachten und zu analysieren. Die re3data API, über welche die Datenbank abgefragt und Informationen zu einzelnen Repositorien extrahiert werden können, unterstützt diesen Anwendungsfall. Beispielsweise liefert re3data Informationen über internationale Forschungsdatenrepositorien an den Open Science Monitor der Europäischen Kommission. Darüber hinaus dient re3data dem OpenAIRE Research Graph als Datenquelle für Forschungsdatenrepositorien.

Vielen Zwecken dienlich

re3data ermöglicht verschiedene Anwendungsfälle, die über reines Discovery von Forschungsdateninfrastrukturen hinausgehen. Die präsentierte Analyse verdeutlicht auch die große Bandbreite an Literatur und Ressourcen, welche den Dienst referenzieren. Weitere Details und Anwendungsfälle werden in einem neuen Service Model für re3data vorgestellt, das derzeit entwickelt wird und zeitnah veröffentlicht wird.

Das Team steht für persönliche Beratung zur verfügung (E-Mail: info@re3data.org).

Autorinnen

Dieser Beitrag wurde verfasst von Dorothea Strecker (Humboldt-Universität zu Berlin, Institut für Bibliotheks- und Informationswissenschaft) und Nina Leonie Weisweiler (Helmholtz-Gemeinschaft, Helmholtz Open Science Office) in Vertretung für das re3data COREF Projekt.


Über Gastautor(en)

Für einige Beträge können wir Gastautorinnen und Gastautoren gewinnen. Die Namen der Autorinnen und Autoren befinden sich in diesem Fall direkt unter dem jeweiligen Beitrag.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.