燈塔值夜的人,怎麼記住整片迷霧海?
港口陽台冷得刺骨,霧把海平線吃掉了。船影一下出現、一下又不見,燈塔守夜人盯不住每一艘,只好拿小本子記幾筆,讓下一次看到時不會迷路。
看DNA也有點像看這片霧海,只是更長更長。它像一串只用A、C、G、T排成的字母鍊,有些做法得一直回頭比對前後每一段,長度一拉長就開始吃時間、也很吃記憶體。
有兩種新設計叫Caduceus和Hawk,走的是守夜人那套。字母一個個滑過去,它們就更新一份固定大小的「摘要」,像小本子每次只加一行,但本子不變大。對照很直白:字母流像船流,摘要像本子。帶著同一本子走,就不怕路變長。小結:穩定可重用的記憶,能讓判斷在長序列也不容易亂掉。
更意外的是,這種「記小本子」在一般長度也沒比較弱。拿一段大約一萬多個字母的輸入來看,Caduceus在一些工作上常能打平甚至超過常見的基準做法,Hawk在某些變異影響的題目上就沒那麼亮眼。重點不是誰到處都贏,而是這條路在平常尺度也站得住。
夜班被拉長後差別更清楚。沒特別重調的情況下,Caduceus能從一萬多一路推到十多萬個字母,很多題目的表現只小幅變動;Hawk在變異影響的分數也能在更長輸入下撐住。那種一直回頭比對的基準做法,超出舒適圈就容易明顯走樣,就算想補救「位置感」也常不太夠。
最後他們用了個很實際的招:把超長DNA切成一段段能放進記憶體的長度,先跑完一段,再把最後那份摘要交給下一段當起點。就像交班時把同一本值夜本子遞給下一位,故事不會重置。用這種交接,Hawk在單一高階晶片上能一路處理到一百萬個字母左右,變異影響也大致穩。守夜人抬頭看更遠了,但也發現一件事:看得更遠,不等於答案就會自動更好,接下來要學的是怎麼真的用上那片新視野。