调音器一片黑:机器为什么学不会“正确答案”
社区活动室里,乐队在热身。小提琴手夹上电子调音器,拉了一下,音差得远,屏幕却黑着,红绿灯都不亮。他只能靠猜去拧弦轴,排练卡住了。
有些识别图片的电脑程序不只给一个答案,还会给个“不确定度”。它会给每个可能答案攒一点“证据”,证据越多就越有把握;证据几乎没有时,它就等于在说“我不知道”。
怪就怪在,有些做法会把一部分已知答案的样本,推到“证据全是零”的死角。对应到调音器:每个可能音高像一个候选答案,灯的亮度像证据,老师告诉你往哪拧像反馈。全黑时,反馈也几乎没了。带走一句话:全黑的地方,光告诉对错也拉不出来。
他们还发现,证据从“内部打分”变成“亮灯”的方式不同,黑区大小也不同。有的像硬开关,负分直接掐成零,立刻全黑;有的会微微发亮,但错得离谱时亮得像没亮;还有一种会更少全黑,证据低时也会给更明显的推动,证据高时又更像常见的那种稳定训练。
为了解决全黑,他们加了个额外的训练推力,只在“空得发慌”的时候帮一把,专门把正确答案的证据往上抬。更空就推得更用力;一旦证据起来了,这股推力就自己变弱,免得一直抢戏。就像指挥看见调音器黑屏时,先直接指给你该拉哪根音,等灯亮起来再放手。
用那种更少全黑的证据方式,再配上这股“空了就推”的补力,卡在近乎零证据的样本少了很多,识别也更稳。更妙的是,“我不知道”没被堵住,它还是能用来筛掉不靠谱的结果,也能提醒遇到了陌生东西。排练继续时,调音器不再一片黑,哪怕音不准,也会给一点方向。