DNA als Speichermedium

Shakespeare in der Petrischale

Wissenschaftler haben Sonette von Shakespeare auf DNA gespeichert und wieder dekodiert. Mit der Methode könnten Daten künftig Jahrtausende überdauern.

So könnten die Archive der Zukunft aussehen: Repräsentation von menschlicher DNA.  Bild: reuters

Wissenschaftler vom European Molecular Biology Laboratory (EMBL) haben es geschafft, Shakespeares Sonette und Martin Luther Kings Worte „I have a Dream“ auf DNA zu speichern. Wie eine winzige Menge Staub sehe es aus, schreiben die Autoren über das Ergebnis jahrelanger Arbeit.

taz paywall

Ist Ihnen dieser Artikel etwas wert?

Mehr Infos

taz.de

Der Vorstoß aus dem heidelberger Institut ist vor allem interessant für die dauerhafte Speicherung großer Datenmengen. Schließlich ist DNA sehr haltbar und kompakt. 100 Millionen Stunden hochauflösendes Filmmaterial würden in eine kleine Teetasse DNA-Material passen. Einmal vollständig synthetisiert, könnte diese Tasse voller Filmmaterial noch in vielen Tausend Jahren abgerufen werden. CDs können dagegen nach spätestens 50 Jahren nicht mehr gelesen werden.

Die Wissenschaftler des EMBL haben für die Speicherung erstmals eine Kodierung entwickelt, eine kommerzielle Nutzung der DNA für Archivare in Aussicht stellt. In den vergangenen 30 Jahren hatten Forscher immer wieder Versuche angestellt, die DNA als Biodatenträger zu etablieren. Dabei sind durchaus auch schon vorzeigbare Ergebnisse generiert worden. „Die Dekodierung und Kodierung von DNA ist heute eigentlich kein Problem mehr“, erklärt Ralf Zimmer von der Ludwig Maximilian Universität München der taz. „Wissenschaftlich wird das heute schon im großen Stil gemacht.“ Erst vor einem halben Jahr ist es dem Harvard-Professor George Church gelungen, sein eigenes Buch auf DNA zu speichern.

Dass die Versuche bislang jedoch kein massentaugliches Modell hervorbrachten, lag vor allem an den technischen Möglichkeiten. Anders als im menschlichen Körper können Daten künstlich nur auf sehr kurze Stränge übertragen werden. Die Sequenzen, in die Daten üblicherweise übersetzt werden, sind wesentlich länger. Jede Datei muss bei der Speicherung auf DNA so in kleine Fragmente zerstückelt werden. Diese Fragmente dann wieder zusammenzusetzen führt in der Regel zu schwerwiegenden Dekodierungsfehlern.

Aus der Not eine Tugend gemacht

Geht ein Fragment verloren, verschiebt sich die gesamte Datenfrequenz. „Wir waren uns bewusst, dass wir für unseren Code lediglich kurze DNA-Stränge verwenden durften. Außerdem musste er so beschaffen sein, dass eine Wiederholung desselben Buchstabens praktisch ausgeschlossen war,“ berichtet Projektmitarbeiter Erwin Birney.

Die Forscher generierten für den aktuellen Versuch einen sehr langen DNA-Strang, zerstückelten diesen allerdings und nummerierten die Fragmente. Damit haben sie aus der Not eine Tugend gemacht. Anders als bei einer durchgehenden Sequenz führt der Verlust eines Teilstücks so nicht zur Veränderung des gesamten Codes, sondern lediglich zu einer Lücke. Auf einem Foto würde so nur ein Pixel fehlen.

Dass aus der Theorie auch Praxis werden kann, stellten die Wissenschaftler auch unter Beweis. Erstmals ist nicht nur die Kodierung sondern auch die unabhängige Entzifferung der DNA geglückt. Mitarbeiter des Institutes konnten Shakespeares Sonette wieder fehlerfrei herstellen.

10.000 Jahre haltbar

Nick Goldman vom EMBL ist mit dem Ergebnis sehr zufrieden: „Wir haben einen fehlertoleranten Code entwickelt, der sich einer molekularen Form bedient, von der wir wissen, dass sie unter günstigen Bedingungen 10.000 Jahre oder länger halten kann.“

Ein breiter oder gar privater Einsatz der Technik scheitert aktuell noch am Preis. Die Speicherung von einem einzigen Megabyte kostet momentan rund 9.500 EUR, das Dekodieren um die 170 EUR. Im EMBL gehe man aber davon aus, die Datenspeicherung auf DNA für die Archivierung von Daten in den nächsten zehn Jahren profitabel zu machen.

 

Um einen Kommentar zu schreiben, registrieren Sie sich bitte.

Bitte halten Sie sich an unsere Netiquette.

Sie finden Ihren Kommentar nicht?

Geben Sie Ihren Kommentar hier ein