IDPD17: Ein Tag im Team LZA

read this article in english

 

Der 30.11.2017 ist der erste International Digital Preservation Day (IDPD17). Der IDPD findet zukünftig an jedem letzten Donnerstag im November statt und wurde von der Digital Preservation Coalition ins Leben gerufen, um das Bewusstsein rund um die digitale Langzeitarchiverung zu schärfen und weltweite Aktivitäten zur Erhaltung digitaler Daten sichtbarer zu machen.

Zum IDPD17 gibt das TIB Team Digitale Langzeitarchivierung hier einen Einblick in die tägliche Arbeit.

Oleg Nekhayenko:
Ich bin Oleg und arbeite im DFG-Projekt LaZAR.  Im Rahmen des Projekts entwickle ich zum Beispiel  ein Mapping der Datenbankmetadaten auf Dublin Core und konzipiere den automatischen Ingest in unser digitales Archivs über eine OAI-Schnittstelle.
Neben der Arbeit im Projekt schreibe ich Skripte, zum Beispiel für CD- und USB-Imaging-Workflows, um die digitalen Objekte vom Datenträger zu lösen und die Datenstruktur für die Langzeitarchivierung vorzubereiten.  Wenn ich noch Zeit habe, entwickle ich die Submission Application und den Metadatenproxy der TIB für das Mapping der GVK-Metadaten auf Dublin Core weiter.

Merle Friedrichsen:
Ich habe mich heute damit beschäftigt herauszufinden, welche Online-Zeitschriften aus unserem Bestand bereits von anderen Organisationen archiviert werden, damit wir die Zeitschriften archivieren können, um die sich noch keiner „kümmert“.  Zunächst einmal bekomme ich vom Team Zeitschriften eine vollständige Liste der Online-Zeitschriften aus unserem Bestand. Das Keepers Registry sammelt die Informationen von verschiedenen archivierenden Institutionen wie Portico , CLOCKSS Archive  oder auch der Library of Congress . Über eine Schnittstelle kann abgefragt werden, welche Institution welche Jahrgänge einer Zeitschrift archiviert. Mein Kollege Oleg hat ein Skript geschrieben, dem ich eine Liste der ISSNs übergeben kann, die Antwort der Schnittstelle kann dann als Tabelle ausgewertet werden. Und siehe da: ein Großteil unserer Zeitschriften ist noch nicht archiviert!

Thomas Bähr:
Nicht jede Institution hat die Möglichkeit, eigene Lösungen für die Langzeitarchivierung bereitzustellen. Deshalb haben wir Angebote entwickelt, um die Langzeitarchivierung anderen als Dienstleistung anzubieten. Und da jede Institution andere Anforderungen und Rahmenbedingungen hat, arbeite ich an Konzepten, um Antworten auf die vielfältigen technischen, organisatorischen, rechtlichen und finanziellen Fragen zu finden. Das schafft man natürlich nicht alleine, sondern ein großartiges Team arbeitet daran Tag für Tag mit.

Michelle Lindlar:
Die TIB wird heute von einer chinesischen Delegation des Institute of Medical Information and Library / Chinese Academy of Medical Sciences besucht. Im Rahmen des Besuchs findet ein Austausch zu Aktivitäten rund um die Digitale Langzeitarchivierung statt. Auf die Vorträge der KollegInnen aus China bin ich schon sehr gespannt! Immerhin hat China 2004 die erste von mittlerweile 14 iPRES Konferenzen (International Conference on Digital Preservation) ausgerichtet!
Des Weiteren  stehen heute noch ein paar Aufgaben aus der „Rosetta Format Library Working Group“ (FLWG) an. Die Roadmap des Produkts Rosetta, welches wir zur Archivierung unserer Bestände einsetzen, wird von Kunden mitbestimmt. Input kommt aus verschiedenen Arbeitsgruppen, in denen sich Rosetta Kunden weltweit zu bestimmten Themen austauschen. In der FLWG geht es – wie der Name vermuten lässt – um Formate. Gemeinsam mit Kollegen aus Neuseeland, den USA, der Schweiz,  Belgien und Deutschland überprüfen wir aktuell das Mapping verschiedener technischer Metadaten Extraktoren auf das Rosetta DNX Profil.

Franziska Schwab und „Nimbie“:
Unser Kopierroboter Nimbie und ich befassen uns derzeit mit einem Projekt, um einzigartige Retrodigitalisate von BMBF-Forschungsberichten in Form von TIFF-Mastern, PDF-Derivaten und OCR-Dateien auf gebrannten CDs zu sichern. Die ältesten CDs sind bis zu 13 Jahre alt und wurden von einem Dienstleister gebrannt. Hier ein kurzer Steckbrief dazu:

Projekt: Massensicherung von Files auf CD mit dem Nimbie USB plus Roboter
Bestand: ca. 14.000 CDs mit alten Retrodigitalisaten von einem Dienstleister
Ressourcen: 1 Mensch 2 ½ h / Tag, 1 Roboter 9-10 h / Tag
Hardware: Kopierroboter Nimbie USB Plus mit ASUS BW-16D1HT Laufwerk und USB-Anschluss
Software: Disc to Computer

Workflow:

  1. Nimbie mit 100 CDs beladen
  2. Disc To Computer: Konfiguration überprüfen und Zielverzeichnis setzen
  3. Kopiervorgang starten
  4. …3 Stunden später…
  5. Log speichern und auf Fehlermeldungen überprüfen
  6. Nimbie entladen
  7. Checkliste für die Dokumentation des Kopierprozesses und zur Überprüfung auf Dubletten ausfüllen
  8. Überprüfen der kopierten Files auf Vollständigkeit
  9. Nimbie mit 100 CDs beladen

Im Anschluss laufen Skripte zur Vorbereitung der kopierten Files für die Langzeitarchivierung:

  1. CD-Verzeichnisse mit dem passenden Katalogidentifier benennen
  2. Definieren von Repräsentationen