Deine Daten, meine Daten, Forschungsdaten

Deine Daten, meine Daten, Forschungsdaten – unter diesem Titel fand am 9. Mai 2019 im Rahmen der Veranstaltungsreihe zum Digitalen Salon an der TIB in Hannover ein Vortrag zu den vielfältigen Gesichtspunkten des wissenschaftlichen Umgangs mit erzeugten Daten statt. Die Vortragsfolien finden Sie hier: 10.5281/zenodo.3228089

Forschungsdaten. Politik, Forschungsförderer und die Gesellschaft fordern den (offenen) Zugang zu diesen Daten, doch wie sieht die Realität aus? Welche Vorbehalte gibt es, welche (rechtlichen) Einschränkungen und was bedeutet eigentlich FAIR?

Aus der Perspektive einer ehemaligen Ozeanographin berichtete ich zunächst von meinen eigenen Erfahrungen im Bereich des Forschungsdatenmanagements, angefangen von der Ermittlung von Häufigkeiten des Vorkommen bestimmter arktischer Planktonarten bis hin zu der Auswertung von Langzeit-Satellitendaten der Meereisentwicklung im Nordpolarmeer. So gehört ein gutes  Datenmanagement in der Klimaforschung schon seit vielen Jahrzehnten zur guten wissenschaftlichen Arbeit – und ohne die Nachnutzung von Daten externer Forschergruppen ist es für Forschende aus diesem Bereich kaum möglich, eine Dissertation zu erstellen.

Auch in anderen Disziplinen stellen komplexe kleine oder große Datenmengen und die zunehmende Digitalisierung die Wissenschaftlerinnen und Wissenschaftler vor immer neue Herausforderungen – sei es bei deren Erhebung, Auswertung, in der Speicherung, Publikation oder in der Nachnutzung externer Forschungsdaten. Ein sorgfältiges Datenmanagement ist m. E. nach schon immer eine wesentliche Aufgabe von Forschenden; denn ohne dieses ist die Erstellung einer wissenschaftlichen Publikation in einer renommierten Zeitschrift (deren Bedeutung gerne durch das Motto ‚Publish or Perish‘ hervorgehoben wird, s. auch den Auftaktvortrag des Digitalen Salons, Fake in Science – Schummeln in der Wissenschaft) kaum möglich. Doch erst in den letzten Jahren hat das Bewusstsein für ein nachhaltiges Forschungsdatenmanagement auch in Fachdisziplinen, die bisher ohne einen Datenaustausch oder die Nachnutzung externer Daten zurechtkamen, deutlich zugenommen.

Vor diesem Hintergrund geben die FAIR Data Prinzipien einen Leitfaden für einen „guten“ Umgang mit diesen Daten – ganz im Sinne der guten wissenschaftlichen Praxis. FAIR steht für Findable, Accessible, Interoperable und Reuseable und zielt sowohl auf den richtigen Umgang mit den Daten seitens der Forschenden (z.B. auf eine ausreichende Beschreibung dieser mit guten Informationen zu Experiment/Methode, Zeitraum, Voraussetzungen, befolgte Protokolle, etc. – sogenannten Metadaten) als auch auf die ausreichende Bereitstellung geeigneter Infrastrukturen ab: So ist Forschungsdatenmanagement seit einigen Jahren in aller Munde, was sich nicht zuletzt im Aufbau von zahlreichen Infrastrukturen (z.B. institutionellen Forschungsdatenrepositorien und Beratungsservices) an zahlreichen Universitäten und außeruniversitären Forschungseinrichtungen wiedergespiegelt hat. Im Vortrag wurde z.B. auf die Plattform https://re3data.org hingewiesen – die bisher größte und umfassendste Suchmaschine für Forschungsdatenrepositorien weltweit.

Auch die Nachnutzung von Forschungsdaten ist oftmals ein Thema, das Wissenschaftlerinnen und Wissenschaftler verunsichert: Was darf ich mit Daten Dritter anfangen, welche Richtlinien oder auch forschungs-ethische Aspekte muss ich beachten und was versteht man unter Nutzungslizenzen für Forschungsdaten? Am Beispiel der Creative Commons (CC) Lizenzen wurde dies im Vortrag vorgestellt.

Mit der anschließenden Diskussion, die unter anderem Fragen zu weiteren verfügbaren Infrastrukturen wie der Suchmaschine Google Dataset Search und dem generischen Repositorium Zenodo beinhaltete, endete der zweite Vortrag dieser Reihe.

... leitet das Lab Research Data Services an der TIB.