當電腦變成搜救犬:從遊戲學會面對真實世界
想像一隻剛入學的小狗來到搜救訓練中心,這天陽光普照,場地平坦。眼前的木板坡道和隧道一目瞭然,就像早期的電腦學下棋一樣。規則很死板,棋盤都在眼前,沒有任何意外。小狗只要看清楚起點和終點,照著既定的路徑跑就行了,這時候的世界是完全可預測的。
但真實世界沒這麼簡單。教練把場景換到了起霧的森林模擬場,地上坑坑洞洞,視線很差。這就像電腦開始挑戰複雜的戰略電玩,沒辦法一眼看穿全圖,只能根據眼前晃動的像素做判斷。就像小狗在霧裡不能只靠眼睛,系統必須學會處理混亂的資訊,在看不清全貌的情況下做出決定。
為了怕小狗死背路徑,訓練場引進了一台機器,每天早上自動挖新隧道、把樹移位。這對應到 AI 自己設計關卡的技術。場地天天變,小狗就不能只背地圖,而必須真正學會「如何導航」。系統這樣做,是為了確保它學到的是應變的真本事,而不是作弊背答案。
接著難度升級,一群狗要合力拖動一根大木頭,還不能亂叫,只能靠默契。這就像遊戲裡的「多角色合作」。電腦控制的角色不能只顧自己衝,得學會觀察隊友。一隻狗的動作,完全取決於另一隻狗怎麼配合,這考驗的不再是單打獨鬥,而是複雜的溝通與協調。
最後,圍欄全撤掉了。沒有指定的跑道,也沒有過關獎勵,只剩一片荒野。這就像《Minecraft》這類開放世界遊戲,沒有所謂的「贏」,只有生存和建造。電腦得聽懂像「蓋個避難所」這種模糊的指令,然後像回到大自然的狗一樣,靠自己的本能去探索、去適應這個沒有規則的世界。
故事的最後,這隻訓練有素的狗走出模擬場,踏進真正的災難現場,在瓦礫堆中自信穿梭。這就是遊戲研究的終極目標:那些數位遊樂場不只是為了玩,而是最安全的試煉場。我們在那裡訓練電腦的大腦,好讓它們最終能跨出螢幕,協助解決真實世界的複雜難題。