Das Logbuch im Nebel: Wie man lange DNA-Strecken nicht vergisst
Der Leuchtturmwärter steht auf dem kalten Balkon. Nebel frisst die Kante vom Meer, ein Schiff taucht kurz auf, dann ist es weg. Er kann nicht alles im Blick behalten, also schreibt er ein paar Zeilen in ein kleines Logbuch.
DNA fühlt sich ähnlich an, nur viel länger. Sie ist eine Kette aus vier Buchstaben, und sie kann riesig werden. Viele Programme schauen hin und her, als müssten sie jedes Schiff mit jedem vergleichen. Bei sehr langen Strecken wird das schnell zäh.
Zwei neuere Ansätze, Caduceus und Hawk, machen es wie der Wärter. Bei jedem neuen DNA-Buchstaben wird ein kurzer, fester Merksatz aktualisiert, wie eine neue Zeile im Logbuch, ohne dass das Buch dicker wird. Merksatz bleibt, Orientierung bleibt.
Als man sie mit einem bekannten Vergleichsmodell gegeneinander laufen ließ, waren sie bei normalen Längen nicht schwächer. Caduceus kam bei Aufgaben wie Gen-Aktivität oft mit oder lag vorn. Hawk war bei manchen Aufgaben zu Varianten eher hinten.
Dann wurde die Strecke viel länger, ohne Extra-Feintuning. Caduceus ließ sich von etwa 12.000 auf etwa 120.000 DNA-Buchstaben strecken, mit nur kleinen Änderungen in den Ergebnissen. Hawk blieb bei Varianten-Einschätzungen stabil, auch weit über das Gewohnte hinaus.
Für ultralange DNA nahm man Stücke, die in den Speicher passen. Ein Stück wird gelesen, dann wandert der letzte Merksatz ins nächste Stück, wie wenn der nächste Wärter das gleiche Logbuch übernimmt. So schaffte Hawk bis etwa 1.000.000 Buchstaben auf einem starken Chip, aber mehr Länge allein macht die Antworten noch nicht automatisch besser.