Projekt TAPIR: PID-basierter Datenimport in VIVO mit „generate2vivo“

read this article in English

Die Ausgangslage

Im Rahmen des vorangegangenen TIB-Blog-Artikels über die Macht der persistenten Identifier (PID) hat sich das Projekt TAPIR bereits kurz vorgestellt und die ersten Projektschritte mit der interessierten Öffentlichkeit geteilt. Doch es gibt da noch mehr, was wir gerne mit Ihnen teilen möchten!

TAPIR – was war das nochmal?

Das Projekt TAPIR (= TeilAutomatisiertes Persistent-Identifier-basiertes Reporting) ist ein vom BMBF gefördertes Verbundvorhaben von TIB und Universität Osnabrück (UOS). Es beschäftigt sich mit der zentralen Forschungsfrage, inwieweit sich die Forschungsberichterstattung an universitären und außeruniversitären Einrichtungen (teil-)automatisieren lässt und das mit Hilfe von persistenten Identifikatoren (PIDs), wie ORCID, ROR und DOIs; dies vor dem Hintergrund, dass die zunehmenden, wiederkehrenden Berichtspflichten im Rahmen der Forschungsberichterstattung – wie z. B. die jährliche Erstellung der Leibniz-Reports oder die Erfüllung der Leitlinien zur Transparenz in der Forschung – meist mit viel Zeit- und Arbeitsaufwand verbunden sind. Hier setzen wir an: Inwieweit lässt sich die Sammlung, Aggregation und logische Verknüpfung von offen verfügbaren Forschungsinformationen mittels persistenter Identifikatoren (PIDs) durchführen? Wie können diese extern abgefragten Metadaten in Forschungsinformationssysteme integriert und anschließend in vordefinierten Reports wieder ausgegeben werden?

Import-Tool „generate2vivo“

Nachdem im vorherigen Artikel das Query-Tool „pidgraphnotebooks“ für einfache Tests von verschiedenen Datenabfragen aus OpenAlex, ORCID, CrossRef etc. vorgestellt wurde, möchten wir heute das von der TIB entwickelte Import-Werkzeug „generate2vivo“ (zunächst „datacitecommons2vivo“) in den Ring werfen. Das flexibel erweiterbare Tool ermöglicht die Abfrage von PID-referenzierten Daten aus ausgewählten externen Datenquellen und den automatisierten Import in ein Forschungsinformationssystem (FIS). Im Rahmen unseres Projektvorhabens nutzen wir das Linked-Data-basierte Open-Source-Forschungsinformationssystem VIVO, die sich bei beiden Projektpartnern TIB und UOS seit Jahren erfolgreich im Einsatz befindet.

Bis dato ist es möglich, erste Import-Abläufe aus dem FREYA PID GraphCrossRefORCID und ROR durchzuführen, die abgefragten Daten auf die VIVO-Ontologie zu mappen und ins VIVO zu integrieren. Über unsere sogenannte „Organzation-person query“ können z. B. alle Personen abgefragt und importiert werden, die über eine ROR affiliiert sind.

Mehr Informationen zu den Datenquellen und einzelnen Abfragen, die zur Verfügung stehen, haben wir in einem Wiki gesammelt. Die gesamte Dokumentation sowie die Quellcodes zu „generate2vivo“ stehen bereits für die freie Nachnutzung über das GitHub Repository zur Verfügung.

Probieren Sie es aus – „generate2vivo“ in den TAPIR Labs!

Um einen Einblick in unsere Forschungs- und Entwicklungsarbeit zu geben, haben wir das Tool „generate2vivo“ und eine angeschlossene Test-VIVO-Umgebung innerhalb der TIB Labs zur Verfügung gestellt. Hier können individuelle Abfragen und Testimporte – mit der ROR ID der eigenen Institution, mit der eigenen ORCID iD oder einzelnen DOIs – ausprobiert und direkt in VIVO betrachtet werden.

Probieren Sie es einfach aus in den TAPIR Labs!
Ein kurzes „Hands on“ (PDF) zeigt Ihnen, wie es funktioniert. 

Ausblick – What’s next?

Testen, Testen, Testen! Wir werden nicht nur das Import-Tool weiterhin auf Praxistauglichkeit testen, sondern auch untersuchen, inwieweit sich extern abgefragte und im VIVO gesammelte Daten (zukünftig) für ein Forschungsreporting eignen können. Außerdem arbeiten wir an einer Reporting-Komponente für VIVO.

Folgen Sie uns gerne auf unserer Projekt-Webseite oder via Twitter!

Kathrin Schnieders

… arbeitet an der Universität Osnabrück im Bereich des strategischen Controllings und Forschungsinformationssystems. Darüber hinaus arbeitet Sie im gemeinsamen Forschungsvorhaben von TIB und UOS im Projekt TAPIR