漁網師傅多穿幾道線,讓影像線索不再走丟
小港口的棚子裡,師傅補漁網防風浪。他不只把新一排縫到上一排,還拉一條細線穿回更早的每一排,讓最後一拉,很多結一起受力。重點很直白:連得多,訊息反而更清楚。
以前做很深的影像辨識,就像接力織網:每一排只把最新那條邊交出去。早期如果有個結打得漂亮,後面常常看不到,只好又打一次,線越用越浪費。拉到最後,最早的結幾乎沒感覺,錯了也不容易被發現。
DenseNet把同一段網面改了規矩:在同一塊網裡,新的一排可以直接拿前面所有排當材料。不是把它們揉成一條線,而是並排放著。對影像來說,就是把早先的線索原封不動留在旁邊,後面想用哪個就拿哪個。
並排的線索一直堆也會太厚,所以它有兩個省事的習慣。每加一排,只添一小撮新線,其他靠重用。要打比較費力的結前,先把一大把線穿過導環收一下,下一個結就綁得更快也更乾淨。
網面要換大小時,師傅會修剪、摺一摺再接下一段,免得拖著一堆鬆線跑。DenseNet也一樣:一段密密共享線索後,就做一次縮小和整理,讓畫面變小一點、線索也更精簡,再進到下一段繼續共享。
拿去跟常見的深層影像系統比,DenseNet常常能做到差不多甚至更好的辨識,卻不用背那麼多資料、也少做一些運算。師傅摸著網邊笑了笑:以前總以為要更強就得一直打新結,原來把舊結一直接得上,網就更穩。