Jetzt neu: RDF-Export der Metadaten des AV-Portals der TIB

read this article in english

Die Technische Informationsbibliothek (TIB) hat sich zum Ziel gesetzt, Nutzung und Verbreitung ihrer Sammlungen zu fördern. Vor diesem Hintergrund veröffentlicht die TIB die autoritativen sowie die zeitbasierten, automatisch generierten Metadaten von Filmen des AV-Portals der TIB als Linked Open Data. Hiermit bietet die TIB einen neuen Service, der Datensätze zur Weiternutzung im Standard-RDF-Format zur Verfügung stellt.

Was ist Linked Open Data?

Linked Open Data (LOD) bezeichnet verlinkte und unter freien Lizenzen veröffentlichte – und somit nachnutzbare – strukturierte Daten, die per Uniform Resource Identifier (URI) identifiziert werden. URIs ermöglichen die Vernetzung und Abfrage von Ressourcen und sind weit stabiler als Uniform Resource Locators (URLs). Zur Kodierung der Daten wird das flexible und maschinenlesbare Resource Description Framework (RDF), der Standard zur Beschreibung von Metadaten, verwendet. Das RDF-Modell basiert auf einer sogenannten Tripel Struktur; hierbei werden ein Subjekt und ein Objekt über ein Prädikat in Beziehung gesetzt. So ermöglicht LOD die Verknüpfung und Anreicherung von Metadaten und somit das Auffinden verwandter Medien im Web of Data, aber auch die Nachnutzung der Daten.

Warum Linked Open Data?

Der Nutzen von LOD liegt in der Bereitstellung strukturierter Daten, die maschinenlesbar sind und von Dritten nachgenutzt werden können. Bibliotheken machen somit ihre Bestände im Web noch besser sichtbar, ermöglichen bessere und effizientere Suchanfragen und erleichtern ihren Nutzern das Auffinden und Verknüpfen relevanter Informationen. Im Gegensatz zu Linked Data wird Linked Open Data unter freien Lizenzbedingungen publiziert und ist somit frei nutzbar.

Zahlreiche Institutionen bieten bereits das Herunterladen ihrer Datensätze im RDF-Format an. In ihrem Datenshop stellt die Deutsche Nationalbibliothek (DNB) beispielsweise Bibliotheken und anderen Kunden Titeldaten der DNB und Normdaten der GND zur Verfügung. Die European Library, ein Online-Dienst, der die Bestände von 48 europäischen Nationalbibliotheken und zahlreichen wissenschaftlichen Bibliotheken erschließt, stellt 95 Millionen bibliographische Titeldaten zur Verfügung, darunter auch ein Subset von etwa 20 Millionen bibliographischen Titeldaten von 34 britischen Partnerbibliotheken.

Die Europeana, die europäische virtuelle Bibliothek des wissenschaftlichen und kulturellen Erbes europäischer Geschichte, stellt bereits seit Oktober 2012 Metadaten unter einer freien Lizenz bereit. Dieses Angebot umfasst 20 Millionen Objekte, darunter nicht nur Texte, sondern auch Bilder, Videos und Tondokumente.

Linked Open Data im AV-Portal der TIB

Mit dem AV-Portal (av.tib.eu) hat die TIB gemeinsam mit dem Hasso-Plattner Institut eine nutzerorientierte Plattform für wissenschaftliche Filme entwickelt. Das Portal ermöglicht den freien Zugang zu hochwertigen Computervisualisierungen, Simulationen, Experimenten, Interviews sowie Vorlesungs- und Konferenzaufzeichnungen aus dem Bereich Technik und Naturwissenschaften. Die automatische Videoanalyse des AV-Portals umfasst eine strukturelle Analyse (Szenenerkennung) sowie eine Text-, Audio- und Bildanalyse. Die automatische Erschließung des AV-Portals der TIB beschreibt die Videos auf Segmentebene und ermöglicht dadurch eine zielgenaue Suche innerhalb der Videos. Die Filme sind mit einem Digital Object Identifier (DOI) versehen und somit eindeutig referenzierbar. Die einzelnen Filmsegmente werden mit einem Media Fragment Identifier (MFID) versehen, mit dem das Video sekundengenau referenziert und zitiert werden kann.

Unter https://av.tib.eu/opendata stellt die TIB nun auch die Metadaten sowie Vorschaubilder von audiovisuellen Materialien im RDF-Format zur Verfügung, für die eine Nutzung unter der Lizenz CC0 1.0 Universal vereinbart worden ist. Bitte beachten Sie, dass die Daten teilweise automatisch generiert wurden und daher Fehler enthalten oder unvollständig sein können. Die Datensätze werden zukünftig vierteljährlich aktualisiert.

Darüber hinaus steht den Nutzern auf der oben genannten Seite ein Tutorial zur Verfügung, das einen kurzen Überblick über die Strukturen der Datensätze des AV-Portals der TIB gibt. Es wird erläutert, wie die Datensätze in eine RDF-Datenbank importiert und mit SPARQL abgefragt werden können.

Zum Thema dieses Blogbeitrages siehe auch Paloma Marín Arraiza, „Scientific Audiovisual Materials and Linked Open Data“:

.

 

Autorinnen:

Margret Plank, Leiterin Kompetenzzentrum nicht-textuelle Materialien
Sandra Simon, Referendarin