Welche Bedeutung haben Forschungsinformationssysteme im chinesischen Raum? – Mit dem Open Science Lab über den Tellerrand geschaut

(English version of this article) Die Beschäftigung mit strukturierten, vernetzten und webbasierten Forschungsinformationen findet zurzeit vorwiegend im US-amerikanischen und europäischen Raum statt – so könnte zumindest der Eindruck bei einer ersten Recherche entstehen.

Die freie Software VIVO, die ursprünglich an der Cornell University entwickelt wurde, findet bisher vor allem im US-amerikanischen Raum Verbreitung, dort auf der Basis institutioneller Cluster. Für Forschungsinformationen einer Fach-Community, die gebündelt und durchsuchbar gemacht werden, ist AgriVIVO ein europäisches Pilotprojekt. Darüber hinaus wurden Initiativen zur Bildung einer europäischen Community gestartet, wie das VIVOcamp13 und das im Rahmen der Konferenz ELAG 2014 unter dem Motto „VIVO for beginners“ stattfindende VIVOcamp14.

Ich habe mich gefragt, ob VIVO, oder vergleichbare freie oder kommerzielle Software für Forschungsinformationssysteme (FIS oder englisch CRIS), nicht auch in anderen Regionen der Welt zum Einsatz kommt oder ob die Vorteile solcher Fach-Community basierten FIS in Kreisen wissenschaftlicher Bibliotheken und Forschungseinrichtungen diskutiert werden. Es stellt sich nämlich die Frage, warum eine Initiative für ein VIVO-Bündnis für Fach-Community basierte FIS nur auf Europa und die USA beschränkt bleiben sollte.

Beispielhaft für FIS im nicht europäischen und US-amerikanischen Raum habe ich mir die Entwicklung in der Bibliotheks- und Forschungslandschaft im chinesischen Raum angeschaut, d.h. in der Volksrepublik China, Taiwan, Hong Kong und Macao. Zum einen ist dieser Sprachraum rein quantitativ nicht zu vernachlässigen, immer mehr Kooperationsprojekte in den verschiedensten Fach-Communities werden zwischen Europa und den hier untersuchten Ländern aufgebaut. Außerdem existiert insbesondere in der Volksrepublik China ein recht zentral organisiertes Wissenschaftssystem, wo eventuell größere Projekte wie der koordinierte Aufbau von FIS schneller und nachhaltiger durchgeführt werden können.

Soweit zu den Vorüberlegungen. Schauen wir uns einmal an, was es bereits an Forschungsinformationsstrukturen im chinesischen Raum gibt:

Zunächst ist festzuhalten, dass im FIS-verwandten Bereich Institutioneller Repositorien (IR) eine große Bandbreite an Open Access-Dokumentenservern an den chinesischen Wissenschaftseinrichtungen zu finden ist, deren Inhalte häufig auch über internationale Plattformen wie OpenDOAR und ROAR recherchierbar sind. Herausragend unter diesen IRs ist das University of Hong Kong Scholars Hub; es wurde auf der Website Ranking Web of Repositories unter denen in Asien auf dem ersten Platz gelistet. Das besondere an dem HKU Scholars Hub, das auf der freien DSpace-Technologie basiert, ist, dass auf das IR ein FIS aufgesetzt und die Daten verknüpft wurden.

Gemeinsam mit dem non-profit Konsortium italienischer Wissenschaftseinrichtungen CINECA hat die Universität einen Weg eruiert, bereits vorhandene Daten aus administrativen Systemen zu Personen, Projekten, Institutionen etc. mit dem IR zu verbinden. Die DSpace Technologie wurde somit um das selbst entwickelte CRIS-Modul erweitert, das auf dem von EuroCRIS entwickelten CERIF-Datenmodel basiert. DSpace-CRIS ist seit November 2012 als Open Source-Anwendung frei verfügbar. Im nächsten Release (3.2 und 4.0) soll DSpace-CRIS auch den Export und Import von CRIS-Entitäten in CERIF XML 1.6 anbieten.

Im November 2013 wurde DSpace-CRIS auf dem Mitgliedertreffen von EuroCRIS vorgestellt. Der Präsident von EuroCRIS schreibt im Newsletter der Institution zu DSpace-CRIS, „[t]his module extends the DSpace software with CRIS metadata elements and as such is a concrete illustration of the growing awareness by the repository community of the relevance and importance of CRIS and their extended contextual metadata set.“

Nach der Entwicklung von DSpace-CRIS ist anzunehmen, dass in Kürze einige weitere FIS auf der Basis dieses Moduls entstehen werden. Auch in China, Taiwan und Macao ist DSpace als Technologie für IR weit verbreitet.

Ist es demnach aber schlüssig, als Trend im chinesischen Raum den Aufbau institutioneller FIS zu prognostizieren? Institutionelle FIS dienen einerseits als Research Information Management System (RIMS) für die lokale Administration der Wissenschaftseinrichtung von Personal, Projekten, Publikationen, Forschungsgeldern etc. Andererseits dienen sie als Plattform zur Kommunikation an Wissenschaftler anderer Einrichtungen, an Geldgeber der öffentlichen Hand und auch an Unternehmen, welche Ausstattung, welche Forschungsaktivitäten und welche Forschungsergebnisse es an der eigenen Institution gibt.

Aus Sicht des Open Science Lab der TIB sind institutionelle FIS jedoch erst der erste Schritt. Der tatsächliche Mehrwert für den Aufbau von FIS liegt in der einrichtungs-, länder- und sprachübergreifenden Verknüpfung dieser Informationen. Der nächste ambitionierte Schritt ist, institutionenübergreifende FIS für Fach-Communities zu bilden. Ein visionäres Ziel könnte jedoch das Zusammenfassen dieser Fach-Community basierten FIS zu einem transdisziplinären Netzwerk sein. Wäre es dann nicht möglich, dass Forscher_innen mit ganz ähnlichen Forschungsansätzen und -fragen aus verschiedenen Disziplinen durch diese Vernetzungen zueinanderfinden würden? Erhoffter Mehrwert solcher Netzwerke wäre damit, Raum für neue Kooperationen und Forschungsthemen in Randbereichen zwischen den Disziplinen zu eröffnen.

VIVO als transdisziplinäres Netzwerk ist im Vergleich zu DSpace-CRIS so angelegt, dass Daten nicht nur manuell eingespeist sowie lokal importiert und exportiert werden können, sondern dass auch mittels eines Harvesters Forschungsinformationen aus dem Netz aus vordefinierten Websites von wissenschaftlichen Einrichtungen, Repositorien, Verlagen, Social Media, Förderern etc. eingesammelt werden können. Diese Daten sind zumeist im XML-Format und werden in VIVO-kompatible Tripel konvertiert und Namensräume entsprechend der VIVO-Ontologien angepasst.

VIVO hat mittlerweile weltweit Kooperationspartner; darunter ist auch die National Science Library der Chinese Academy of Sciences (CAS). 2010 stellten Vertreter der National Science Library das bereits seit 2008 laufende Projekt Subject Knowledge Environment (SKE) auf der jährlichen VIVO Konferenz anhand eines Posters vor. Demzufolge ist die Idee des SKE, dass Forscher und Institutionen individuelle SKEs für Institutionen, Projekte, Forschergruppen und Fach-Communities gründen, die schließlich in einem großen Netzwerk zusammen die gesamte Wissenschaftslandschaft der CAS abbilden sollen, mit Angaben zu Forschern, Forschungsaktivitäten, -ergebnissen und -daten, Veranstaltungen, Job-Angeboten, Ausstattung, Fördermöglichkeiten etc. Die SKEs basieren auf Vitro, einer Webapplikation mit integriertem Editor für Ontologien, die an der Cornell University für VIVO entwickelt wurde. Auf der Basis der Websites verschiedener Institute der CAS sowie Social Network Angeboten wie Douban, Kaixin, Facebook oder YouTube wurde eine spezielle SKE-Ontologie gebaut.

Die oben beschriebene Idee ist anhand der SKE-Projektwebsite der CAS in ihrer Struktur bereits erkennbar. Von der SKE-Projektseite aus lassen sich Informationen über das Projekt und Installationsanweisungen finden und es besteht Zugriff auf die individuellen Websites der ins Leben gerufenen Pilotprojekte, beispielsweise die Tibetan Plateau Research Information and Knowledge Platform oder das Scientists Network in Plant Sciences Research.

SKEs werden in China mittlerweile an ca. 20 Instituten der CAS verwendet. Als weitere Maßnahmen zur Verbesserung der Grundstruktur des SKE wurden die Datenintegration und der Austausch von Daten mit Dritten angekündigt. So ist aktuell ein Export der Daten aus der Datenbank in XML/OWL möglich, sodass diese VIVO-kompatibel abgerufen werden können. Als weitere Entwicklungsschritte wurden die Verbesserung der Benutzungsmöglichkeiten der Plattform und der Ausbau der Serviceangebote für die Nutzer angekündigt. (Quelle auf chinesisch)

Das Projektteam der National Science Library hat zusammen mit den Forschergruppen beim Aufbau der SKEs zunächst auf den manuellen Import von Daten gesetzt. Aktuell werden für ein SKE 2.0 auch Wege zum automatisierten Harvesten und Einpflegen von Daten aus dem Netz erprobt. Vor diesem Hintergrund bleibt es spannend, wie es mit dem Projekt weitergeht.

Meine Recherche und die beispielhafte Vorstellung der zwei Projekte HKU Scholars Hub und CAS SKE zeigen, dass nicht nur im europäischen und US-amerikanischen Raum die Wichtigkeit strukturierter, offener und vernetzbarer Forschungsinformationen erkannt wird. Umso mehr sind ein weltweiter Austausch und die Vernetzung der verschiedenen Initiativen notwendig, um sich auf international anerkannte Standards zu einigen. Ein Schritt, mit dem das Open Science Lab in diese Richtung wirken will, ist sein Beitrag zu der diesjährigen CRIS Konferenz in Rom.

Dieser Blog-Beitrag entstand im Rahmen eines Praktikums im Open Science Lab der TIB.