Forschungsdatenmanagement – oder wer kümmert sich um meine Daten?

Am 18.11.2013 hatte der Vizepräsident für Forschung, Prof. Dr. Klaus Hulek zusammen mit dem Dezernat Forschung und EU-Hochschulbüro, Technologietransfer, den Leibniz Universität IT Services und der TIB/UB zu einer Informationsveranstaltung zum Thema „Forschungsdatenmanagement an der Leibniz Universität Hannover“ geladen. Darin wurden in kurzen Vorträgen die Themen Forschungsdatenmanagement, Archivierung, externe Anforderungen an ein Datenmanagement sowie rechtliche Aspekte angesprochen und anschließend mit den Teilnehmern (bestehend aus Wissenschaftlern und Professoren) diskutiert.

Im Nachgang zu dieser Veranstaltung möchte ich mit diesem Beitrag einige für Sie als Wissenschaftler wichtige Punkte aufgreifen und sich daraus ergebende mögliche weitere Entwicklungen diskutieren. 

Was ist Forschungsdatenmanagement eigentlich und warum ist es wichtig sich als Wissenschaftler damit  zu beschäftigen?

Allgemein gesagt bedeutet Forschungsdatenmanagement (FDM) die Organisation und Verwaltung digitaler Daten, die während Ihres Forschungsprozesses entstehen. Konkret schließt das neben der Planung von Forschungsaktivitäten auch die Erzeugung, Dokumentation, Analyse, Speicherung und Bewahrung Ihrer Daten ein. Auf dieser Grundlage können diese Daten anschließend durch Veröffentlichung mit anderen Forschern geteilt, von diesen nachgenutzt und z.B. mit DOI-Namen auch zitiert werden.

Der Nutzen von FDM erschließt sich vor allem aus der Nachnutzung der Daten. Nicht nur werden Ihre Forschungsergebnisse nachvollziehbar und reproduzierbar und können mit guten Daten untermauert werden, sondern die Veröffentlichung und Zitierfähigkeit von Daten kann ebenso einen positiven Einfluss auf Ihre wissenschaftliche Annerkennung und Reputation haben. Durch den verbesserten Zugang zu Forschungsdaten anderer können Sie Ihre wissenschaftliche Arbeit effizienter gestalten, v. a. durch Vermeidung von Doppelarbeit. Aber auch die Verfügbarkeit von einzigartigen Datenbeständen, wie z. B. Klima- oder Wetterdaten, kann eine immense Bereicherung der eigenen Forschung sein.

Wie können Forschungsdaten strukturiert werden?

Die Strukturierung der Forschung und der darin produzierten Daten ist ein wichtiger Teil des Forschungsdatenmanagements. Dafür sind sogenannte Datenmanagementpläne von großem Nutzen. Sie beinhalten nicht nur Informationen darüber, was für Daten erhoben werden, sondern erfassen auch Verantwortlichkeiten, administrative Punkte sowie Hinweise zu Archivierung und Zugriff der Daten. Ein Beispiel eines Datenmanagementplans aus einer Universität in Großbritannien finden Sie hier.

Neben den o. g. Punkten sind weiterhin beschreibende Information zu den Daten, sogenannte Metadaten, enorm wichtig nicht nur für die Nachnutzung durch andere, sondern auch die eigene Nachnutzung. Daten ohne Kontextinformation können auch für Sie als Datenproduzent zu einem späteren Zeitpunkt schwer zu interpretieren sein. Umso ausführlicher eine Beschreibung des Datensatzes ist, desto geringer auch das Risiko einer missverständlichen Interpretation oder gar falschen Verwendung.

Außerdem sollten die beschreibenden Metadaten digitaler Datensätze gewissen (fachspezifischen) Standards folgen sowie maschinenlesbar sein. Auch damit erhöht sich die Möglichkeit einer übergreifenden Nachnutzung.

Wo werden Forschungsdaten gespeichert?

Derzeit werden Forschungsdaten überwiegend auf privaten oder institutionellen Festplatten oder auch auf eigenen USB-Sticks gespeichert. Für eine möglichst breite Nachnutzung sind diese Speicherorte allerdings denkbar ungeeignet. Eine Archivierung in Rechenzentren in einem sogenannten „Dark Archive“ verringert zwar das Risiko des Datenverlustes, aber eine effiziente Nachnutzung ist durch Zugriffsbeschränkungen auch hierbei nicht gewährleistet. Idealerweise werden Forschungsdaten in dafür vorgesehene Repositorien bzw. Datenzentren archiviert und zugänglich gemacht. Allerdings fehlen in vielen Disziplinen solche Infrastrukturen und eine nationale, generische Lösung existiert noch nicht. Derzeit laufen hier in unterschiedlichen Richtungen verschiedene Aktionen, so dass auch bereits kommerzielle Unternehmen wie figshare oder ResearchGate bereits die Speicherung wissenschaftlicher Daten anbieten. Es ist jedoch zu empfehlen, Daten in disziplinspezifischen oder aber auch wissenschaftlichen Einrichtungen zu speichern. Eine Liste von fach- und interdisziplinären Repositorien finden Sie auch bei der Registry of Research Data Repositories (re3data) oder bei der DataBib Initiative. Dort können Sie gezielt nach Repositorien aus Ihrem Fachgebiet suchen.

Welche Bedarfe haben die Wissenschaftler und was können wir als Bibliothek davon abdecken?

Forschungsdatenmanagement umfasst wie oben schon angedeutet ein weites Spektrum an Aufgaben, die zum Teil auch bei den Forschern selbst angesiedelt sein müssen. Schließlich sind Sie am besten vertraut mit Ihren Daten. Aber bei der Bewältigung dieser Aufgaben können Ihnen unterschiedliche Akteure unterstützend und beratend zur Seite stehen. Einer dieser Akteure im Lebenszyklus von Forschungsdaten kann die Bibliothek sein. Die TIB hat hier schon einen Service im Bereich DOI-Registrierung aufgebaut. Allerdings richtet sich dieser mehr an Institutionen (Datenzentren) und weniger an den einzelnen Wissenschaftler.

Dennoch müssen Sie sich als Wissenschaftler mit den im Datenmanagement zu bewältigen Aufgaben nicht alleingelassen fühlen. Wir als Bibliothek können Ihnen bei vielen Fragen zum Forschungsdatenmanagement behilflich sein. Noch gibt es kein professionelles Beratungsangebot, doch auf Basis der Fragen von Forschenden an der LUH sind wir dabei unsere Expertise in diesem Bereich auszubauen. Außerdem gibt es bereits Leitfäden zum FDM von führenden Informationseinrichtungen weltweit. Ganz vorne mit dabei ist der Australia National Data Service (ANDS). Aber auch in Deutschland gibt es bereits Aktivitäten zum FDM, wo u. a. im WissGrid Projekt ein Leitfaden zum Forschungsdatenmanagement ausgearbeitet und veröffentlicht wurde.

Insbesondere sind jedoch Sie als Wissenschaftler gefragt, Zeit und Überlegungen in ein gutes FDM zu investieren, um am Ende Ihre Forschung bestmöglich veröffentlichen und nachnutzen zu können.