數位裁縫師:如何教電腦剪出完美的輪廓
想像一位手藝精湛的裁縫師正要剪裁一套西裝,但工作桌上畫滿了粗糙的方格線。規定很死板,剪刀只能落在格線交叉點上,不能剪在格子中間的空白處。這就像早期的電腦視覺系統,雖然能大致框出物體,但因為被數位格線鎖死,根本無法描繪出精確的圓弧線條。
麻煩的是,當袖子或領口的版型剛好落在兩條線中間時,裁縫師被迫選邊站,剪出來的邊緣就會像鋸齒一樣不平整。換到照片裡,這種「四捨五入」的誤差,會讓電腦在標記人群時變得笨手笨腳,不是削掉某人的肩膀,就是把背景雜物也一起剪了進來。
新的方法引入了一種「浮動尺」,完全無視那些格線限制。它不再硬要把點對齊到交叉口,而是參考周圍四個點的顏色深淺,用數學方法推算出空白處該有的樣子。這樣一來,剪刀就能在格線之間自由滑動,順著版型原本的弧度走,再也不會出現那些討厭的鋸齒邊。
為了更精準,這套方法還改變了裁縫師的思考順序。以前系統一邊要猜這是絲綢還是棉布,一邊又要剪形狀,容易分心搞砸。現在把工作拆開來:一部分專心負責剪出完美的輪廓,另一部分專門負責辨識材質。分工合作後,剪裁工具不再被標籤困擾,準確度自然大幅提升。
結果這套系統現在能瞬間看懂照片裡幾十種不同的東西,不管是人、車子還是雨傘,都能沿著邊緣畫出像素等級的完美輪廓,不再只是一個粗略的方框。這種精準度甚至能用來定位人體的關節位置,把原本模糊的猜測,變成了清晰靈活的動作地圖。