那個沒貼標籤的包裹,讓星球數量也變得不可信
夜班分貨,我把一個箱子翻來翻去。紙箱磨得粗粗的,膠帶貼得很整齊,可是標籤少得可憐:沒寄件代碼、沒路線、也看不出掃過哪幾台機器。丟進「已送達」那堆很快,但要回頭算清楚,就沒得查。重點是:清單不夠,走過哪裡才讓數字站得住。
找外星系的行星也一樣。大家用不同辦法找,有的是看星光變暗,有的是看星星被拉得晃一下,有的是在強光旁邊硬抓到一個淡淡的點。問題是,每份行星清單旁邊的註記都不一樣,有的很細,有的很薄,還有人只放成圖片。想問「這種大小的行星到底多常見」時,就卡住了。
有人提出一個很務實的補法:每份行星清單都要附上一包電腦好讀的「標籤資料」,而且按找到的方式整理。就像所有物流公司先約好同一種標籤格式,車子和掃描器可以不同,但貼法一致。還分兩層:第一層是基本款,通常手邊就有;第二層是更完整的追蹤表,方便之後仔細對帳。
這包「標籤資料」大致分三塊,像包裹標籤加上隨附清單。第一塊寫看了哪些星星、為什麼挑它們、星星資料從哪來。第二塊寫每顆星被看了幾次、什麼算過關、還有這次搜尋大概看得到什麼。第三塊才是行星本身的量測,外加每個候選有多可靠、像真的但其實不是的情況多常見。最關鍵的是:每顆星各自的「抓得到機率」,就像每個包裹的掃描紀錄。帶走一句:一顆一顆知道會漏掉什麼,才敢把不同清單拼在一起。
還有個堅持很像分貨現場的規矩:先把真正量到的東西留下來,別急著把它硬翻成「大概是一本書」那種猜測。因為不同找法本來就量到不同東西,硬換算只會把後面的人綁死。也別只交出最後那堆「成功送達」,排序規則、掃描紀錄都要留,連用假包裹測系統會漏什麼的結果也要一起放,最好是表格和能重跑的工具,不是只給一張漂亮圖。
快下班時,我想像一個比較安靜的集散場:每個箱子都有同一套基本標籤,需要時再加一張完整追蹤表,而且副本放在大家找得到的公共倉庫,不會卡在某個抽屜裡。行星清點想要的也是這種秩序。新鮮的不是新花招,而是把證據貼好標籤,讓大家能重算、能公平比,最後才看得清銀河裡行星到底怎麼分布。