Die Herausforderung

Die Gesellschaft für Informatik suchte 2014 nach großen Herausforderungen („Grand Challenges“), welche die Forschung in den nächsten Jahren zu bewältigen hat. Der folgende Text wurde von unserer Fachgruppe als Challenge eingereicht und adressiert das Problem der dauerhaften Bewahrung des digitalen kulturellen Erbes. Die GI hat unseren Vorschlag als Grand Challenge 1 angenommen.

Download InvitationAktuell: Lesen Sie den gemeinsamen Artikel mit der FG Knowledge Media Design im Informatik-Spektrum Sonderheft „Grand Challenges der Informatik“: Erhalt des digitalen Kulturerbes

Sicherstellung der langfristigen Bewahrung und des Zugangs zu den digitalen Artefakten unserer Gesellschaft

Die Digitalisierung ist tief in die Gesellschaft eingedrungen. Digitalisiert sind inzwischen die alltägliche Kommunikation (Telefon, E-Mail, Chat), die Rezeption von Informationen (Portale im Netz, Nachrichten, Twitter), die Schaffung kultureller Güter (persönliche Fotografien, Musik, Video, komplexe Software und interaktive Medien, Computerspiele) sowie Forschung und Lehre (Forschungsdaten). Ohne dass wir uns dessen bewusst sind, machen wir unser kulturelles Vermächtnis von der Haltbarkeit von Datenträgern, Softwareentwicklern und Dateiformaten abhängig.

Im Gegensatz zu analogen Daten- bzw. Informationsträgern, die eine Haltbarkeit von mehreren 100 bis 1000 Jahren (wie Mikrofilm, Papier, Steintafeln) erreichen können, haben digitale Datenträger eine Haltbarkeit von wenigen Jahren bis Jahrzehnten. Zudem sind digitale Daten nur mit Hilfe der richtigen Software interpretierbar und damit nur mittelbar lesbar bzw. darstellbar. Es existiert eine Myriade von Dateiformaten – und täglich kommen neue hinzu.

Proprietäre Dateiformate und Software schaffen eine digitale Kultur, in der nachhaltige Softwareentwicklung nahezu nicht durchzusetzen ist. Spezielle Hardware (Prozessoren, Mobilplattformen, eingebettete Systeme) wirkt einer nachhaltigen Kulturgüterproduktion ebenfalls entgegen. Sowohl das Digital Rights Management (DRM) als auch die Benutzung von Cloud-Services entmündigen die Nutzer und entziehen ihnen die Gewalt über ihre eigene Daten, wodurch auch hier nachhaltige Konzepte nicht Fuß fassen können.

Es droht der Verlust einer Vielzahl digitaler Artefakte und digitaler Kulturgüter nicht nur auf lange Sicht, sondern schon in nächster Zeit.

Die Grand Challenge hat demnach mehrere Facetten:

  • Breites Problembewusstsein in der Gesellschaft, beim Gesetzgeber aber auch bei Informatikerinnen und Informatikern schaffen
  • Workflows und Best Practices erarbeiten (inkl. rechtlicher Rahmenbedingungen für Exitstrategien aus der Cloud oder die Nachnutzung alter Software)
  • Technik entwickeln, die Workflows der Langzeitarchivierung unterstützt und dabei auf große Datenmengen skalierbar ist.

 

Warum ist das Problem schwierig?

Die Langzeitbewahrung digitaler Objekte birgt große technische Herausforderungen und ist darüber hinaus ein interdisziplinäres und internationales Problem, was ein schnelles Handeln und Konsens erschwert.
Technische Fragen bzgl. Bewahrungsstrategien sind zudem in keiner Weise geklärt, es gibt bisher keine Erfahrungen über lange Zeiträume (50-100 Jahre). Dabei ist nicht nur die Frage der Erhaltung und Zugänglichmachung ein Problem, sondern auch, wie man den Informationsverlust bei bestehenden Lösungsansätzen minimieren kann. Zudem sind technische Systeme prinzipiell unzuverlässig. Erschwerend kommt hinzu, dass die Thematik (obwohl sie im Grunde jeden betrifft) in der Gesellschaft nicht als Problem wahrgenommen wird.
Zudem ist die gesetzliche Lage nicht an die technische Realität angepasst. Teilweise erschwert das Recht die Langzeitarchivierung (Urheberrecht mit langen Schutzfristen), teilweise sind Institutionen auch nicht verpflichtet zu archivieren (bspw. Rundfunkanstalten). Neuere Entwicklungen wie die Regelungen zu verwaisten Werke, reflektieren das Problem in einer unbefriedigenden Weise.
Und auch wenn Lösungen in Zukunft in Sichtweite sein werden, müssen diese langfristig tiefgreifende soziologische, politische, kulturelle/gesellschaftliche und technische Veränderungen überstehen und als Lösungen akzeptiert, konsequent angewandt und weiterentwickelt werden.

In welchem Zeithorizont wird eine Lösung erwartet?

Langzeitarchivierung umfasst eine Fülle unterschiedlicher Prozesse. Es ist kein einmaliger Vorgang, sondern eine dauerhafte Aufgabe. Lösungen müssen immer wieder neu für den konkreten Fall entwickelt und angepasst werden (s. o.) Ob allerdings die bisherigen Lösungen fruchten, kann endgültig erst in ein paar Jahrzehnten verifiziert werden. Auf der anderen Seite werden Lösungen so schnell wie möglich benötigt, weil digitale Systeme schon jetzt zu Verlusten kultureller Güter führen (selbst große Institutionen wie die NASA oder Firmen wie Amazon mit ihren Cloud-Services haben bereits Daten durch die oben genannte Problematik unwiederbringlich verloren). Innerhalb der nächsten Dekade müssen zumindest Software- und Archivprozesse im Hinblick auf eine Langzeitarchivierung modelliert und standardisiert bzw. ausgerichtet werden.

Welche Anstrengungen wurden bereits in die Lösung investiert und welche Disziplinen müssten zusammenarbeiten?

Es gibt Annäherungen zwischen den einzelnen beteiligten Disziplinen wie der Informatik, den Bibliotheks- und Informationswissenschaften, Geschichtswissenschaften, der Rechtswissenschaft und Gedächtnisorganisationen wie Museen, Archiven und anderen  kulturbewahrenden Institutionen. Der Dialog wird auch immer wieder mit Vertretern der Zivilgesellschaft geführt. Daraus haben sich bereits eine Reihe von Langzeitarchivierungsprojekten entwickelt, die mögliche Wege (vorrangig mittels Migration und Emulation) aufzeigen. Erste technische Lösungen werden bereits vereinzelt erprobt (z. B. (C)LOCKSS). Immer wieder jedoch stellt das Urheberrecht diese Versuche vor teilweise nicht gangbare Wege.

Mögliche Lösungansätze der Grand Challenge

Es gibt mehrere Ansatzpunkte: Aus technischer (informatischer) Sicht muss, um die Erhaltung der Datenbestände zu bewerkstelligen, ständig umkopiert, umformatiert und emuliert werden. Dies kann nur nachhaltig erfolgen, wenn Open-Source-Software und offene Standards verwendet werden. Wichtig bei der Entwicklung sind Dokumentationen und Unit-Tests, d. h. eine transparente und nachvollziehbare Programmierung mit Rücksicht auf langfristige Nutzung und Erhaltung sowie die Verwendung von standardisierten Entwicklungsmodellen  (MVC u. ä.). Entwickelt werden müssen außerdem noch Testverfahren, die helfen, die Zuverlässigkeit von Langzeitarcivierungsmethoden abzuschätzen.
Aus informations- und bibliothekswissenschaftlicher Sicht müssen Definitionen und Best Practices erarbeitet sowie eine Vereinheitlichung und Umsetzung geeigneter Metadaten durchgesetzt werden. Zudem sollten übergreifende Institutionen geplant und unterstützt werden.

Das Urheberrecht sollte an die technische Realität angepasst und tatsächlich zu einem fairen Ausgleich aller Interessen entwickelt werden. Dazu gehören sowohl internationale Vereinbarungen zum Angleich unterschiedlicher Rechte als auch die Anpassung von Schutzfristen (auch in Zusammenhang mit DRM) sowie spezielle Regelungen für kulturelle Gedächtnisorganisationen. Auch sollte der Umgang mit Cloud-Services und anderen Netzdiensten im Sinne der Nutzer geregelt werden.

Welche sozialen / gesellschaftlichen / ökonomischen Probleme lassen sich mit der Grand Challenge adressieren?

Mit Strategien der Langzeitarchivierung können wir vermeiden in ein „Digital Dark Age“ katapultiert zu werden, indem wir das kulturelle Erbe erhalten. Damit  kann man  u. a. das  Menschenrecht auf kulturelle Teilhabe stärken.

Kontakt

Jens-Martin Loebel
loebel@uni-bayreuth.de
Sprecher GI Fachgruppe Langzeitarchivierung