2 Minuten FDM: Was ist Forschungsdatenmanagement?

Veröffentlicht am 2. Juni 20208. November 2023 von Frauke Ziedorn

Willkommen zu unserer Reihe „2 Minuten FDM“. In mehreren kurzen Blogbeiträgen werden wir Ihnen hier grundlegende Aspekte des Forschungsdatenmanagements (FDM) näherbringen. Wenn Sie danach weitergehende Fragen haben, können Sie gerne direkt die Autorin kontaktieren oder das FDM Service Team der Leibniz Universität Hannover (LUH).

Doch was ist FDM eigentlich? Dies wollen wir uns anhand eines Beispiel-Projektes anschauen:

Die Astronomin Franka Forscher aus Deutschland möchte untersuchen, wie viele Sternschnuppen in einem bestimmten Zeitraum an verschiedenen Standorten zu sehen sind. Besonderes Augenmerk soll dabei auf den Bewölkungsgrad des Himmels gelegt werden. Dazu bittet sie eine Kollegin, Sofia Ciencias, aus Gran Canaria und einen Kollegen, Lindsay Stars, aus Australien um Hilfe.

Lindsay bekommt seine Beobachtungsdaten von drei Observatorien in drei verschiedenen Bundesstaaten: in Coonabarabran, New South Wales (NSW), in Gingin, Western Australia (WA) und in Hobart, Tasmania (TAS). Er lässt sich für den Beobachtungszeitraum das jeweilige Datum, den Bewölkungsgrad und die durchschnittliche stündliche Anzahl der Meteore (ZHR) zuschicken und fasst die Daten in einer einzelnen Exceltabelle zusammen. Als zusätzliche Information trägt er das Kürzel des Bundesstaates ein, aus dem die Daten kommen. Die Tabelle enthält aussagekräftige Überschriften.

Sofia erfasst die Sternschnuppen-Daten an zwei Standorten: In der Teide-Sternwarte auf Teneriffa und in Roque de los Muchachos auf La Palma. Auch sie erfasst das Datum, den Bewölkungsgrad, die ZHR und einen Code für den Standort. Sie erstellt eine einfache Textdatei mit komma-separierten Werten. Welcher Wert an welcher Stelle steht und welcher Code welchen Standort bezeichnet, beschreibt sie in einer separaten ReadMe-Datei.

Nach Ende der Datenaufnahme schicken sowohl Lindsay als auch Sofia ihre Dateien an Franka, die diese zusammenführen will. Bei den australischen Daten ist ihr nicht klar, was die Standortkürzel bedeuten und für welches Observatorium genau sie stehen. Bei den spanischen Daten fehlt die ReadMe-Datei, so dass sie raten müsste, welcher Wert in welcher Spalte steht. Auch hier weiß sie nicht, welcher Code zu welchem Observatorium gehört. Um diese Informationen zu bekommen, muss Franka erst noch einmal ihre beiden Kontakte fragen. Zusätzlich muss Franka noch die Datumsformate vereinheitlichen, um die Beobachtungsdaten zeitlich sortieren zu können, denn Lindsay hat das Datumsformat JJ-MM-TT genutzt, Sofia das Format TT.MM.JJJJ.

Dieses Beispiel soll einmal zeigen, wo die Fallstricke beim Umgang mit Daten liegen. Einheitliche Planungen und Vorgaben ersparen allen Beteiligten Aufwand und verhindern zeitintensive Nachfragen. Welche Aspekte genau beim FDM wichtig sind und worauf man dabei jeweils achten sollte, darum geht es in dieser Blogreihe.

Idee und Inspiration zu dieser Blogreihe stammen von Alastair Downies Blogreihe Bite-sized RDM.