快递大厅里，图片终于学会分工了

天还没亮，快递大厅已经亮着白灯。分拣台边的人眯着眼认一个糊掉的门牌号，楼上看全场的人却一眼发现，两个角落里的包裹其实要走同一条长线。要是让一个人两头都管，传送带很快就会卡住。

很多后来的看图办法，就像大厅里主要靠楼上那双眼。远处怎么连起来，它很会看；可贴得很近的小纹路，或者同一样东西一会儿大一会儿小，它都得从头慢慢学。说白了，就是拿一套本事硬扛两份活。

ViTAE换了思路，它先把站点改了。包裹进来，不是立刻粗粗打成一包，而是先从近处、中间、稍远一点都摸一遍线索；同时开两路，一路盯分拣台上的边角纹路，一路盯大厅里隔很远的对应关系。新地方就在这儿，两路一起跑，不再排队。

后面的站点也照这个节奏走。一路继续看边缘和细小起伏，一路继续看远处哪些该算一伙，然后再把两边看到的东西揉到一起。到了ViTAEv2，它又把一个大大厅拆成好几层分拣区，细的和粗的都不丢。这样它不只会认出东西叫啥，还更会把东西找出来、勾出范围、盯住身体关键点。

最忙的前几层，它还会省力。楼上那路不用老盯全场，只看自己那一小片就够了，因为分拣台那路已经把附近位置带起来了，省掉了不少额外提醒。碰上被挡住一部分的图，它会先盯住露出来的小方块，过后再把视线放回周围一圈。

这套分工从小版本到大版本都很吃得开。它不用老是靠更多练习去补课，也更会找东西、描范围、跟住姿态。安静但很关键的一步，其实就是不再假装一双眼能从零学会所有看法。分拣台看近处，楼上看全局，线就顺了。