Ein Freiwilligenprojekt versucht, ukrainische Onlinearchive zu sichern, so lange das noch geht.

Vor einem Jahr ging es in dieser Kolumne um das „Archivierungsloch“: Das frühe Internet – und frühes Internet heißt: bis einschließlich Gegenwart – verschwindet vor unseren Augen, und die eigentlich für Archivierung zuständigen Stellen sehen zu. Es gibt mehrere Möglichkeiten, diese Untätigkeit zu begründen. Zwei der beliebtesten: Erstens sei der digitale Quatsch gar nicht aufhebenswert und zweitens sei das technisch auch nicht machbar. Die Gesamtmenge des Materials wachse schneller als die technischen Möglichkeiten. Bei diesem zweiten Einwand „müsste mal jemand gründlich nachrechnen“ schrieb ich damals, und inzwischen hat mir ein Vortrag die Gelegenheit gegeben, das zu tun. Zwar sind 102 Prozent der Menschheit besser als ich in der Lage, etwas so nachzurechnen, dass das Komma hinterher an der richtigen Stelle sitzt. Aber jedenfalls habe ich versucht, herauszufinden, wie viel Platz digitale Sammlungen eigentlich brauchen. Sie können und sollten selbst nachrechnen, das Material dazu steht im Internet. Noch!

Kaum jemand hat eine realitätsnahe Vorstellung von den Stromkosten des eigenen Handys (ungefähr ein halber Cent fürs Aufladen des leeren Akkus). Beim Platzbedarf digitaler Archive ist es wohl ähnlich. Ich jedenfalls hatte zu Beginn meiner Recherche keine Ahnung und auch keine brauchbare Intuition, wie groß irgendwas Digitales wohl sein könnte. Dabei wäre es nützlich, so eine Intuition zu haben. Man könnte dann sofort widersprechen, wenn jemand sagt „Das können wir nicht archivieren, das sind viel zu große Datenmengen.“

2019 gingen zwei Bilder durch die Medien. Das eine zeigte ein Schwarzes Loch, das zweite die Informatikerin Katie Bouman, wie sie strahlend vor einem Tisch sitzt, auf dem sich Festplatten mit den Daten des ersten Bildes stapeln: Acht Stapel mit jeweils acht Festplatten, auf die acht Terabyte passen. Ein Terabyte sind tausend Gigabyte, ich rechne das um, weil mit Gigabyte momentan die meisten von uns vertraut sind. Es ist die Einheit, in der der Speicherplatz auf dem neuen Handy angegeben wird und der Platz auf dem USB-Speicherstick. Kauft man allerdings eine traditionelle Festplatte – Sie erinnern sich, diese taschenbuchgroßen Dinger, die im Betrieb Geräusche machen – dann steht darauf schon seit über zehn Jahren eine Größenangabe in Terabyte. Seit Ende 2021 gibt es Festplatten zu kaufen, auf die 20 Terabyte passen. Katie Boumans beeindruckender Festplattenstapel fasst nur ein kleinen Teil der Gesamtdatenmenge: Insgesamt wurden für die Abbildung des Schwarzen Lochs 4,5 Petabyte Daten gesammelt, 4500 Terabyte. Heute bräuchte man dafür ungefähr 225 Festplatten, und die Daten würden in dieser Form um die 150 Kilogramm wiegen. Für einen ist so ein Schwarzes Loch also zu teuer und zu sperrig.

Problemlos herumtragen lässt sich dagegen die Schattenbibliothek Sci-Hub. Sci-Hub enthält knapp 90 Millionen wissenschaftliche Artikel, das sind über 95 Prozent aller in den großen Wissenschaftsverlagen erschienenen Beiträge. Insgesamt ist die Sammlung 100 Terabyte groß, passt also auf fünf Festplatten. Das macht dreieinhalb Kilogramm, die bequem in einen Rucksack passen.

Brewster Kahle, der Gründer des „Internet Archive“, erzählt in einem Interview, er sei 1996 in den Räumen von Alta Vista zu Besuch gewesen, der wichtigsten Suchmaschine in der Zeit vor Google. „Ich stand vor diesem Gerät, das so groß war wie fünf oder sechs Getränkeautomaten, und hatte einen Aha-Moment: ‚Es geht also alles.‘” In diese fünf oder sechs Getränkeautomaten passte das gesamte Internet von damals. Seitdem ist das Internet ein bisschen gewachsen, was ein Problem wäre, wenn nicht die Festplatten mitgewachsen und gleichzeitig billiger geworden wären. Der heutige Inhalt des Internet Archive würde, auf aktuellen Festplatten gespeichert, etwa 40 getränkeautomatengroße Server-Racks füllen. Real sind es 75, weil das Internet Archive sparen muss und ältere, kleinere Festplatten nutzt. Es ist die einzige Institution, die sich nicht auf „ist doch sowieso alles wertloser Blödsinn“ oder „wir würden ja gern, es ist aber leider technisch unmöglich“ zurückzieht, sondern versucht, möglichst große Teile des Internets vor dem Verschwinden zu bewahren.

Aktuell ist das immer. Gerade ist es noch ein bisschen aktueller, weil das Freiwilligenprojekt „Saving Ukrainian Cultural Heritage Online“ in Zusammenarbeit mit dem Internet Archive versucht, Daten ukrainischer Onlinearchive und Webseiten zu sichern, so lange das noch geht. Wenn Sie sich daran beteiligen wollen, finden Sie alles Nötige unter sucho.org. Und falls Sie beim Lesen dieses Beitrags dachten „tja, es geht doch nichts über das gute haltbare Papier“: Papierarchive aus Kriegsgebieten zu retten ist noch ein bisschen schwieriger.