客廳地板上的照片遊戲,教會電腦別偷懶看顏色
客廳地板鋪滿一疊沖洗照片。我想把同一個地方的照片放同一堆,就算光線變了、畫面放大縮小也要認得出來。有些一眼就懂,有些看起來像陌生地方。
我一開始偷懶,先用「整張偏藍」來分。進度很快,結果很糟,海邊跟游泳池混在一起。電腦也會這樣,看起來很會分,其實只是抱著很淺的線索。
我換了玩法。每張照片我做兩個變形版本,一張只裁一小角,另一張把色調拉暖或拉冷、變亮或變暗。然後我逼自己把這兩張當成同一對,地板上其他照片一律當成不同對。電腦學圖像也能用這招,練習把同一張的兩個版本拉近,把別張推遠。
結果發現,變形的種類很關鍵。只裁切時,我還是會被整體顏色騙到;加上很強的色調變化後,我只好改看輪廓、格局這種比較穩的線索。再加一點點模糊,連小小的銳利細節也沒那麼好偷看。這些變形就像電腦的規矩,專門堵住走捷徑。
我又改了筆記方式。我私下留一份很完整的描述,方便之後整理相簿;但在地板配對時,我用另一個很短的代號,允許丟掉一些細節,只求在亂七八糟的光線下也配得起來。電腦也會先做一份主要描述,再接一小段專門給配對遊戲用的輸出;配對用短的,主要那份留著比較通用。
配對還差一件事,判斷「像不像」要公平。我把筆記整理成同樣的尺度,免得某一種線索壓過全部;我也挑一個嚴格程度,太嚴就幾乎配不到,太鬆就什麼都算一對。電腦也需要把相似分數校準好,再用一個可調的嚴格旋鈕,才不會靠奇怪的打分方式取巧。
照片越堆越多時,我反而越順手。照片少,錯的組合也少,我學不到什麼;照片多,每張旁邊都是「差一點像」的干擾,我就被迫練出更穩的判斷。後來新照片一來,我不用看天空藍不藍,光看形狀和配置就能放對堆。電腦練久一點、一次看更多張,也更容易把這種本事帶去別的看圖工作。