Forschungsdaten und die TIB – Warum brauche ich DOIs für meine Forschungsdaten?

Der DOI ist in der Welt der Wissenschaft bereits ein alter Bekannter. Forscher und Bibliografen nutzen ihn schon seit vielen Jahren als Identifier für Fachpublikationen. In diesem Artikel möchte ich mich jedoch näher der Bedeutung des DOIs in der Registrierung von Forschungsdaten zuwenden.

Wie im vorherigen Artikel „Was ist ein DOI?“ beschrieben, werden auch Forschungsdaten mit einem DOI identifizierbar und somit über das globale DOI-System weltweit erreichbar. Das bedeutet, dass die gesammelten Daten und Analysen, bzw. alle Schritte der wissenschaftlichen Arbeit, mit einem DOI-Namen genauso referenziert werden können, wie ein Journal Artikel oder eine Monographie.

Die eminente Notwendigkeit, Forschungsdaten mehr Rang und angemessene Bedeutung zu verleihen, zeigt sich in den zahlreichen welt-, europa-, und deutschlandweit geführten Initiativen. 2010 hat auch die DFG den Aspekt Nachnutzung von Forschungsdaten im „Leitfaden für Antragsteller“ (S.6)  verankert. In diesem heißt es: „Wenn aus Projektmitteln systematisch (Mess-)Daten erhoben werden, die für die Nachnutzung geeignet sind, legen Sie bitte dar, welche Maßnahmen ergriffen wurden bzw. während der Laufzeit des Projektes getroffen werden, um die Daten nachhaltig zu sichern ggf. für eine erneute Nutzung bereit zu stellen.“ (DFG, 2010)

Fakt ist auch, dass wissenschaftliche  Artikel, mit offenem Zugang zu den dazugehörigen Forschungsdaten, häufiger zitiert werden, als die Artikel ohne Verbindung zu stützenden Daten. 1

Für die Datenveröffentlichung gibt es verschiedene Modelle:

1. Publikation der Forschungsdaten mit einem Artikel:

Sobald ein Artikel in den Veröffentlichungsprozess eines Fachjournals eintritt, werden die während der Arbeit daran entstandenen Forschungsdaten in einem Repositorium langzeitarchiviert und mit einem DOI-Namen versehen. Durch den offenen Zugang zu den relevanten Daten werden Theorien untermauert und nachvollziehbar gemacht. Diese Transparenz erhöht nachhaltig die allgemeine Qualität der wissenschaftlichen Forschung.

Einige der großen Online-Verlage, wie z. B. Elsevier und AGU haben mit Datenrepositorien Vereinbarungen getroffen und verlinken die Forschungsdaten mit den dazugehörigen Artikeln. Im folgenden Beispiel, möchte ich eine sogenannte Kreuz-Verlinkung erläutern:

In einem Journal Artikel in ScienceDirect ist der DOI-Name zu den dazugehörigen Forschungsdaten verlinkt.  Ein Klick auf den DOI-Namen bringt uns auf die Landing Page (Empfangssseite) der Forschungsdaten zu diesem Artikel, langzeitarchiviert in PANGAEA (Datenzentrum des AWI in Bremerhaven). Auf der Landing Page des verlinkten Datensatzes kommen wir mit einem Klick auf den Artikel-DOI im Feld „Citation“ zurück zu dem Journal Artikel in ScienceDirect.

Kuhlmann, H et al. (2009): Age models, iron intensity, magnetic susceptibility records and dry bulk density of sediment cores from around the Canary Islands. PANGAEA - Data Publisher for Earth & Environmental Science. doi:10.1594/PANGAEA.727522
Kuhlmann, H et al. (2009):
Age models, iron intensity, magnetic susceptibility records and dry bulk density of sediment cores from around the Canary Islands. PANGAEA – Data Publisher for Earth & Environmental Science.
doi:10.1594/PANGAEA.727522

Der Artikel in ScienceDirekt öffnet sich und gleichzeitig erscheint rechts, eine dem Terrain entsprechende, geographische Karte. Direkt über der Karte kommen wir, per Klick auf den Eintrag: Pangaea – Related Data, zu den Forschungsdaten:

Kuhlmann, Holger; Freudenthal, Tim; Helmke, Peer; Meggers, Helge
(2004): Reconstruction of paleoceanography off NW Africa during the last 40,000 years: influence of local and regional factors on sediment accumulation.
Marine Geology, 207(1-4), 209-224, doi:10.1016/j.margeo.2004.03.017

2. Eigenständige Veröffentlichung in einem Forschungsdaten-Repositorium :

Dieses Modell erlaubt Wissenschaftlern, unabhängig von einer geplanten Veröffentlichung, die im Arbeitsprozess entstandenen Forschungsdaten zu publizieren. Auch hier werden die Daten mit einem DOI-Namen registriert und langzeitarchiviert. Die Langzeitarchivierung und die Publikation der Forschungsdaten erfolgen in institutseigenen Repositorien oder bei spezialisierten Fremdrepositorien. Zu dem Wie und Wo werde ich in den nächsten Artikeln unserer Reihe berichten.

Welche Vorteile ergeben sich also aus einer Veröffentlichung von Forschungsdaten mit DOI-Namen für den Wissenschaftler:

  1. Positiv für die akademische Reputation. Wenn andere Wissenschaftler irgendwo in der Welt (das DOI-System agiert global!) die publizierten Forschungsdaten nutzt, können diese mit einem DOI-Namen genau so referenziert werden wie andere zitierfähige Quellen.
  2. Thomson und Reuters plant die DOI-Metadaten in ihren Data Citation Index zu übernehmen
  3. Möglichkeit der thematischen Suche. Ein neuer Weg etwas über Ihre Arbeit an bestimmten Themen zu erfahren.
  4. Die Zusammenarbeit auch außerhalb der eigenen Community wird gefördert.
  5. Weitere Erkenntnisse können aus den Forschungsdaten oder der entstandenen Zusammenarbeit entstehen.
  6. Publizierte Forschungsdaten mit freiem Zugang sind ein Gewinn für die Wissenschaft. Hohe Erstellungskosten in kostenintensiven Forschungsbereichen oder die Investitionen in Großgeräten rechtfertigen sich durch die entstehende Transparenz und die Möglichkeit der Nachnutzung.
  7. Nutzung der Daten für weitere Forschung

Es gibt sowohl aus eigenem Interesse, oder auch im Umgang mit den zunehmenden Anforderungen der Förderer, kaum noch einen Weg, diesen Teil der wissenschaftlichen Arbeit zu ignorieren.
Die TIB befasst sich seit 2004 mit dem Thema Forschungsdaten. Den Auftakt machte das DFG-Projekt STD-DOI  im gleichen Jahr. Im nächsten Artikel werde ich mehr über die wesentlichen Schritte und wegbereitenden Entwicklungen die seitdem folgten und in naher Zukunft noch anstehen, berichten.

Bisher sind folgende Beiträge in der Reihe Forschungsdaten und die TIB erschienen:

Notes:
1. Edwin A. Henneken, Alberto Accomazzi, Linking to Data – Effect on Citation Rates in Astronomy, 15.11.11, http://arxiv.org/abs/1111.3618v1, 15.10.12