把耳朵貼在物件上,機器手也能更會拿捏
修車攤邊,輪子還在轉。師傅把煞車調到幾乎不碰碟盤,外表看起來都好好的,卻會冒出一聲很輕的「嘶」。他乾脆用膠帶把一個小小的貼附式麥克風黏在工具上,像把耳朵貼在車架上聽。
機器手做事也常卡在這裡。鏡頭看得到位置,卻常錯過「剛碰到」那一下,分不清是在滑、在卡,或杯子裡其實還有沒有東西。像修車一樣,貼著物件傳過來的震動聲,會把眼睛看不到的狀態說清楚。
有人想把這種「貼著聽」的感覺給機器人。他們先不用機器人,直接做一個手拿的夾爪指頭,下面塞進貼附式麥克風,再用一層止滑膠帶蓋住。麥克風接到運動相機的收音孔,影片和震動聲就被存進同一段檔案裡,手怎麼動、哪裡刮到,全對得上。
後來把同一個夾爪裝到機器手臂上,麻煩就來了。馬達本身會嗡嗡叫,像學徒拿著會尖叫的電動工具在旁邊做事,聲音很容易蓋過接觸的細節。還有一點點時間對不齊,差不多四分之一秒,得先校正,不然機器人聽到時已經來不及反應。
他們讓機器人練習時故意變吵:把背景聲和馬達噪音混進去,免得只會在安靜環境表現好。然後把聲音變成一張會動的「聲音圖」,看得出高低和強弱怎麼變,再用找花紋的方式抓住刮、敲、滑的痕跡。鏡頭畫面加上貼著聽到的震動聲,機器手就能一路做出小幅的轉動、移動、開合選擇。
幾個工作裡,這隻「貼著物件的耳朵」一直很管用。翻東西時,關鍵是鏟子插進去那刻和滑動的觸感,聲音一加上去成功率大幅提高。擦白板時,鏡頭常看不出壓力夠不夠,震動聲會提醒它該加力或放鬆。倒杯子時,光看角度常分不出空不空,人會先搖一搖,貼著聽就聽得出裡面還有沒有。連黏扣帶看起來差不多,指尖一滑的震動花紋卻不一樣,貼附式麥克風比房間收音更可靠。
新鮮的不是多厲害的手,而是多了一個便宜又實用的感覺,還有一套教法:先在日常環境錄下手怎麼做,讓畫面和震動聲鎖在一起,再讓機器人習慣自己的噪音。當互動太輕、震動太弱時,它還是會聽不清。可一旦能像修車師傅那樣把耳朵貼上去,很多原本只能猜的瞬間,就變成敢動手的判斷。