Forschungsdaten und die TIB – Was sind Forschungsdaten?

In einer kleinen Blogreihe möchte ich Ihnen einige Informationen zu Forschungsdaten, DOI-Service und Datenzentren geben und erläutern in wie fern die TIB hier involviert ist und sich verantwortlich fühlt. Beginnen möchte ich mit der Klärung, was Forschungsdaten sind, und ein paar Worte zum Umgang mit Forschungsdaten sagen.

Forschungsdaten sind der zentrale Gegenstand des wissenschaftlichen Erkenntnisprozesses.1

So lautet eine Definition, aber was sind Forschungsdaten nun eigentlich tatsächlich?
In den unterschiedlichen wissenschaftlichen Fachbereichen gibt es sehr viele verschieden Arten von Forschungsdaten, weshalb eine Beispielliste sehr lang werden kann. Im Folgenden habe ich einmal eine kleine Auswahl zusammengestellt, welche Daten in der wissenschaftlichen Forschung anfallen können:

  • Vermessungsdaten
  • Messdaten aus Instrumenten wie einem Teleskop
  • Daten aus einem Massenspektrometer,
  • digitale Karten oder Fotografien
  • Volltexte z.B. zur Erstellung kritischer Editionen
  • Digitale Fotografien
  • Luftbilder
  • Satellitendaten und -bilder
  • Datenbanken
  • 3-D-Rekonstruktionen
  • Filme/Videos
  • Vektorzeichnungen
  • Spektrogramme
  • usw.

Diese Daten werden auch mit weiteren Begriffen benannt, wie z. B. Forschungsprimärdaten, Primärdaten, Roh- oder Urdaten. Diese Daten sind oft nicht nur im Forschungskontext relevant, in dem sie erhoben wurden, sondern sie alle können die Grundlage für weiterführende Forschung darstellen! Dafür ist es jedoch unabdingbar, dass Forschungsdaten nachgenutzt werden können. Voraussetzung für eine spätere Nachnutzung ist die langfristige Verfügbarkeit. Der breite Zugang zu Forschungsdaten erlaubt eine deutliche Verbesserung und neue Perspektiven für das wissenschaftliche Arbeiten.

Die für das Archivieren und Nachnutzen von Forschungsdaten notwendige Infrastruktur wird in vielen Disziplinen gerade erst aufgebaut. Wo welche Forschungsdaten abgelegt oder gefunden werden können, ist nicht immer leicht festzustellen. Manchmal gibt es sogenannte institutionelle Repositorien, in denen Wissenschaftler Daten und/oder auch wissenschaftliche Veröffentlichungen ablegen können. In vielen Fällen jedoch werden Forschungsdaten auf eigenen Festplatten oder USB-Sticks gespeichert. Eine Nachnutzung und Verfügbarkeit ist somit in den meisten Fällen nicht gegeben. Durch ein professionelles Informationsmanagement, welches Daten auch durch beschreibende Metadaten nachweisen kann, muss diesem immer noch vorhandenen Defizit entgegengetreten werden.

Dafür muss jedoch ein neuer Umgang mit Forschungsdaten etabliert werden. Wichtigste Ziele sind dabei:

  1. Eine langfristige und allgemein zugängliche Verfügbarkeit und Speicherung der Daten in generischen oder fachspezifischen Datenarchiven.
  2. Daten sollen nicht mehr ausschließlich Teil einer wissenschaftlichen Publikation sein, sondern durch die Möglichkeit einer eigenständigen Veröffentlichung eine eigene persistente Identität erhalten. Damit würden Forschungsdaten, ähnlich wie Zeitschriftenartikel qualitätsgesichert zitierbar und können auch zur Sichtbarkeit und Reputation von Wissenschaftlern beitragen.

Beim Aufbau von Infrastrukturen zum Forschungsdatenmanagement ist es zudem sicherlich zwingend erforderlich eng mit der Wissenschaft zusammen zu arbeiten, denn die Wissenschaftler der Fachcommunities sollten selber entscheiden dürfen, in welchem wissenschaftlichen Stadium ihre originären Forschungsdaten sinnvollerweise langfristig aufzubewahren sind und dafür auch fachspezifische Qualitätskriterien und Standards formulieren sowie diese dann in ihrer jeweiligen Community etablieren.2

Die Allianz der deutschen Wissenschaftsorganisationen arbeitet daran, die Bereitstellung und Nachnutzung von Forschungsdaten durch die Entwicklung von Standards, Archivstrukturen und Anreizsysteme zu verbessern. Die Identifizierung von Forschungsdaten durch persistente Identifikatoren (z.B. URN, DOI, EPIC) ist dabei ein wesentlicher Schritt u. a. auch zur dauerhaften Zitierfähigkeit dieser Daten und Datensammlungen.3 Hierzu leistet die TIB auch schon ihren Beitrag, in dem sie seit 2005 als erste weltweite DOI-Registierungsagentur für Forschungsdaten aus dem Bereich Technik und Naturwissenschaften fungiert. Mehr dazu gibt es dann im zweiten Teil dieser Blogreihe.

Notes:
1. 3.2 Strategien bei der Veröffentlichung von Forschungsdaten Sünje Dallmeier-Tiessen CERN / Humboldt Universität zu Berlin, Handbuch Forschungsdatenmanagement Herausgegeben von Stephan Büttner, Hans-Christoph Hobohm, Lars Müller BOCK + HERCHEN Verlag Bad Honnef 2011,
http://opus4.kobv.de/opus4-fhpotsdam/files/208/HandbuchForschungsdatenmanagement.pdf
3. Heike Neuroth, Stefan Strathmann, Achim Oßwald, Regine Scheffel, Jens Klump, Jens Ludwig (Hrsg.), Langzeitarchivierung von Forschungsdaten, Eine  Bestandsaufnahme,  Verlag Werner Hülsbusch, Boizenburg, 2012,
http://www.nestor.sub.uni-goettingen.de/bestandsaufnahme/nestor_lza_forschungsdaten_bestandsaufnahme.pdf