快递大厅里,图片终于学会分工了
天还没亮,快递大厅已经亮着白灯。分拣台边的人眯着眼认一个糊掉的门牌号,楼上看全场的人却一眼发现,两个角落里的包裹其实要走同一条长线。要是让一个人两头都管,传送带很快就会卡住。
很多后来的看图办法,就像大厅里主要靠楼上那双眼。远处怎么连起来,它很会看;可贴得很近的小纹路,或者同一样东西一会儿大一会儿小,它都得从头慢慢学。说白了,就是拿一套本事硬扛两份活。
ViTAE换了思路,它先把站点改了。包裹进来,不是立刻粗粗打成一包,而是先从近处、中间、稍远一点都摸一遍线索;同时开两路,一路盯分拣台上的边角纹路,一路盯大厅里隔很远的对应关系。新地方就在这儿,两路一起跑,不再排队。
后面的站点也照这个节奏走。一路继续看边缘和细小起伏,一路继续看远处哪些该算一伙,然后再把两边看到的东西揉到一起。到了ViTAEv2,它又把一个大大厅拆成好几层分拣区,细的和粗的都不丢。这样它不只会认出东西叫啥,还更会把东西找出来、勾出范围、盯住身体关键点。
最忙的前几层,它还会省力。楼上那路不用老盯全场,只看自己那一小片就够了,因为分拣台那路已经把附近位置带起来了,省掉了不少额外提醒。碰上被挡住一部分的图,它会先盯住露出来的小方块,过后再把视线放回周围一圈。
这套分工从小版本到大版本都很吃得开。它不用老是靠更多练习去补课,也更会找东西、描范围、跟住姿态。安静但很关键的一步,其实就是不再假装一双眼能从零学会所有看法。分拣台看近处,楼上看全局,线就顺了。