Langzeitarchivierung von CDs mittels Emulation as a Service

Fast 60.000 über den Katalog abfragbare CDs unterschiedlichen Typs befinden sich im Besitz der TIB. Darunter finden sich Zeitschriftenbeilagen mit Demosoftware, aber auch wertvolle Schätze in Form von Forschungs- und Kongressliteratur, für welche die TIB nahezu im Alleinbesitz ist.

Ob wertvoll oder nicht, an allen Datenträgern nagt der Zahn der Zeit; manche CDs im Magazin sind über 20 Jahre alt und erste auftretende Ausfallquoten deutliches Warnsignal. Um die darauf gespeicherte Literatur zu erhalten, müssen Maßnahmen ergriffen werden, denn die Neubeschaffung ist insbesondere im Bereich der Kongressliteratur ein schwieriges Unterfangen. Doch wie die Literatur auf den vielen CDs vor dem Verfall von Datenträger und der Obsoleszenz des Formats retten?

Eine mögliche Lösung ist das Umwandeln in immer neue Formate (Migration), doch können nicht alle Ausgangsformate auf diese Art erhalten werden – und wie überhaupt die Eigenschaft „ist eine CD“ dauerhaft bewahren? Da das erneute Brennen auf CD für die Langzeiterhaltung aus naheliegenden Gründen keine praktikable Lösung ist, müssen andere Wege beschritten werden.

Eine Alternative zur Migration stellt die Emulation dar, die statt der Anpassung des Formats an neue Nutzungsumgebungen den Erhalt der ursprünglichen Nutzungsumgebung als Ansatz wählt. Bisher war die Emulation für Gedächtnisinstitutionen keine praktikable Lösung; zu aufwändig die Programmierung und Pflege von Emulatoren, zu unklar die Bereitstellungsszenarien.

In Zusammenarbeit mit der Albert-Ludwigs Universität Freiburg erprobt die TIB  in einer Machbarkeitsstudie einen Ansatz für die Langzeitarchivierung von CDs mittels Emulation. Hierbei wird das von der Uni Freiburg entwickelte Emulation-as-a-Service Modell eingesetzt.

Von einer CD wird ein virtuelles Abbild erzeugt, das die Speicherstruktur der Dateien auf der CD nachbildet, ein sogenanntes ISO-Image. Eine erste Testmenge bestand aus 200 CDs, von denen solche Abbilder erzeugt wurden.

Diese werden für die Emulation vorbereitet: Ein Emulator wird ausgewählt, die ursprüngliche Nutzungsumgebung konfiguriert und getestet. Der Nutzer soll beim Zugriff das CD-Abbild nutzungsbereit vorfinden, ohne dass die Installation zusätzlicher Komponenten erforderlich ist. Am Ende der Vorbereitung steht eine zitierfähige Umgebung in Form eines Links und eine Ausgabe einiger technischer Metadaten.
Wählt der Nutzer ein CD-Abbild zur Nutzung aus, wird auf Basis der gespeicherten technischen Metadaten die ursprüngliche Nutzungsumgebung rekonstruiert. Binnen kurzer Wartezeit wird der jeweilige Emulator im Browser geladen, die Konfigurationsdetails aus den Metadaten abgefragt und unter Berücksichtigung der erforderlichen technischen Ressourcen das CD-Abbild in der benötigten Umgebung geladen. Somit steht das ISO-Image nun in seiner ursprünglichen Nutzungsumgebung interaktiv zur Verfügung.

Der neuartige Ansatz dieses Verfahrens besteht in der Aufgabenteilung und der verteilten Ressourcenlösung: Die Emulatoren werden vom Rechenzentrum Freiburg bereitgestellt und gepflegt, zudem werden dort die technischen Ressourcen bereitgestellt. Die Metadaten, die ISO-Images und die modifizierten Nutzungsumgebungen werden in der TIB bereitgestellt, die auf diese Art die Kontrolle über ihre Bestände behält.