Das Vergessen macht sich breit

Das Netz vergisst nie? Von wegen! Papier wird in Bibliotheken fleißig gesammelt, aber wer kümmert sich eigentlich ums Archivieren von Websites und Blogs?

Von Tilman Baumgärtel

Deutsche Bibliotheken sammeln Bücher, Zeitungen und andere journalistische Publikationen. Aber was ist mit den Websites, Blogs oder Social-­Media-Posts, womit heute ein großer Teil des gesellschaftlichen Dialogs geführt wird?

Bisher ist der langfristige Erhalt digitaler Medien für die deutschen Institutionen, deren Aufgabe es ist, das kulturelle Erbe zu bewahren, immer noch weitgehend Neuland. Wenn Internetangebote überhaupt gesammelt werden, dann nur in kleinem Maßstab und oft unter Ausschluss der Öffentlichkeit.

Das hat nicht nur mit institutioneller Trägheit zu tun – auch wenn andere Länder hier deutlich weiter sind als das „Land der Dichter und Denker“. Denn gleichzeitig gibt es eine ganze Reihe von technischen und rechtlichen Hürden, die das Sammeln von Webinhalten komplizierter macht als das von bedrucktem Papier.

Da ist zunächst einmal die schiere Menge. Die Library of Congress in den USA scheiterte 2018 spektakulär daran, allein die Inhalte, die über den Kurznachrichtendienst Twitter verbreitet werden, dauerhaft zu sichern. Obwohl das Unternehmen sogar sein komplettes Archiv zur Verfügung stellte, waren die Datenmengen schlicht zu groß. Seither hebt man nur noch „ausgewählte Tweets“ auf – gerade zu einer Zeit, in der ­@­realdonaldtrump Twitter zu einem politischen Propaganda­instrument machte und in der sozialen Medien eine den Wahlkampf entscheidende Bedeutung zugeschrieben wurde.

Wayback Machine

Das gemeinnützige Projekt Internet Archive in San Francisco – Netz­adresse archive.org – hat mit seiner Wayback Machine das heute beste Webarchiv aufgebaut. In regelmäßigen Abständen lädt man beim sogenannten Webharvesting eine repräsentative Auswahl an Sites automatisch herunter. Dieses Verfahren führt zu einer Momentaufnahme der Webpräsenz, die man Zeitschnitt oder Spiegelung nennt. Allerdings werden nie komplette Websites erhalten, sondern nur eine Auswahl ihrer Inhalte. Funktionen wie die Suchmöglichkeiten oder auch Video- und Audio­inhalte fehlen häufig ebenfalls.

Bei archive.org finden sich durchaus auch deutsche Lokalblogs – allerdings immer nur in Auszügen. Für die Archivierung des Angebots von Facebook, Tiktok oder Telegram, die heute oft die Stelle von Lokalblogs eingenommen haben, hat allerdings auch das Internet Archive bisher keine Lösung gefunden. Auf diese gewinnorientierten Unternehmen selbst sollte man beim langfristigen Erhalt ihrer Inhalte keine Hoffnung setzen. In der Vergangenheit wurden Angebote wie GeoCities oder Yahoo Answers von ihren Anbietern ohne viel Federlesens geschlossen, wenn sie nicht mehr profitabel waren – auch wenn dort Beiträge von Hunderttausenden Nutzern zusammengekommen und diese Angebote ein Stück historisch wichtiger Internetkultur waren.

Was archive.org von den USA aus mit den Websites dieser Welt macht, wäre in Deutschland nicht möglich: Nach deutschem Recht ist schon das Herunterladen von Websites verboten. Ein Archiv, das Lokalblogs sammeln wollte, müsste sich das von den Betreibern zunächst einmal schriftlich genehmigen lassen. Die Macher von manchen Webangeboten hätten wohl oft nicht einmal etwas dagegen – allerdings müssten sie dann sicher sein, dass sie auch das Urheberrecht für alle Beiträge auf einer Site haben, und dafür unter Umständen lang verschollene freie Mitarbeiter oder den Fotografen, der damals dieses eine Bild gemacht hat, wieder auftreiben.

Wenn man die Website nicht nur aufbewahren, sondern auch wieder online zugänglich machen will, sind die rechtlichen Hürden noch höher. Anders als Stadtarchive oder die Archive der Bundesländer hat die Deutsche Nationalbibliothek (DNB) zwar einen gesetzlichen Sammlungsauftrag und darf deswegen Websites speichern. Aber online zugänglich machen darf sie diese nur mit dem Einverständnis der Anbieter. Um die große Mehrzahl der über 7.000 gespeicherten Sites anzusehen, muss man daher zu den Standorten der DNB nach Leipzig oder Frankfurt/Main fahren. Nur 121 der gesammelten Sites sind auch online verfügbar.

In Großbritannien archiviert die British Library seit 2014 eine repräsentative Auswahl von Lokalblogs. In Deutschland hat die Staatsbibliothek Bayern eine Sammlung von Websites mit lokalem Bezug aufgebaut. Hier finden sich zum Beispiel die Website der Bayerischen Landesbibliothek, aber auch „Bavaria – Texte zur bayerischen Geschichte“, eine private Site, die der ehemalige Realschullehrer Kurt Scheuerer angelegt hat. Das digitale Archiv des Erzbistums München und Freising ist ebenso gespeichert wie die Website, die ein Historiker als „kritische Ergänzung zu den im Buchhandel erhältlichen Werken zur bayerischen Landesgeschichte“ entwickelt hat und die „besonders die Geschichte der Frauen, der Minderheiten und der Ausländer“ darstellen soll, weil diese in der Geschichtsschreibung häufig keine Rolle spielten. So dokumentiert die Sammlung der Staatsbibliothek Bayern sehr gut die verschiedenen Methoden, wie das Internet in der Lokalpublizistik genutzt wird: als offizielles Verlautbarungsorgan ebenso wie als Plattform für Minderheiten und Andersdenkende. Allerdings sind es insgesamt nur 1.500 Websites, die von der Bayerischen Staatsbibliothek im Augenblick systematisch gesammelt werden; ihre Zahl soll in der Zukunft steigen.

Von einer einigermaßen repräsentativen Sammlung lokaler Web­sites ist man also im Augenblick noch weit entfernt. Derzeit sind viele Stadtarchive schon damit überfordert, die digitalen Dokumente, die ihre eigene Stadtverwaltung produziert, langfristig zu archivieren und zugänglich zu halten.

Ein „E-Pflichtexemplar“

Ändern könnte sich das durch die neuen Richtlinien für ein „E-Pflicht­exemplar“, das auch Onlinepublikationen einschließt. So wie Verlage schon seit je ihre Veröffentlichungen bei ihrer jeweiligen Landesbibliothek abliefern müssen, sollen dann auch wichtige Websites den staatlichen Archiven zur Verfügung gestellt werden.

Das kann allerdings noch dauern: Die meisten Bundesländer arbeiten derzeit an einer Durchführungsbestimmung, wie diese Abgaben praktisch und technisch ablaufen und für wen sie überhaupt gelten sollen. Doch rückwirkend soll auf jeden Fall nicht gesammelt werden. Schon jetzt ist auch klar, dass angesichts der riesigen Menge digitaler Publikationen, die oft genug nicht von etablierten Verlagen kommen, allenfalls eine kuratierte Auswahl in den digitalen Datenspeichern der staatlichen Archive landen wird.

Die hyperlokalen Publikationen aus der Frühzeit der Blogs dürften nicht dazugehören, wenn sich nicht eine Institution findet, die sich darum kümmert. Sie werden verschwinden, wie das von Foucault beschriebene Gesicht im Sand am Meeresufer.