圖書館貼紙越多人貼,真的越公平嗎?
忙碌的圖書館後台,一桌新書旁放著一捲捲彩色貼紙。志工翻幾頁就貼上「適合全家」或「要小心」。館員找好幾個人都貼一次,最後用最多人選的那張當定案。小提醒是:怎麼把一堆小判斷合起來,會悄悄決定系統相信什麼。
館員本來覺得,人多就能沖淡個人怪癖。結果有些志工對某些作者或某種角色特別嚴格,這不是亂猜,是往同一邊歪。歪的人一多,「最多人選的貼紙」就會變成很有把握的偏心。
有人想知道這種「往同一邊歪」是不是常見,就去看兩大堆真實的貼標紀錄,而且那些題目本來就有標準答案。一堆是看像司法情境的案例描述;另一堆是判斷短留言有沒有毒。這樣就能同時看出每個人哪裡貼對、又常常偏向哪一群。
有意思的是,偏心不只出現在隨便貼的人身上。有些志工整體其實很常貼對,卻還是會對某一群特別容易貼上「要小心」。所以「貼得準」不等於「貼得公平」,兩件事常常不同步。
更麻煩的是,多數決常常剛好被那群偏心的人佔了多數。於是定案貼紙會跟標準答案對調,不是大家看不懂,是偏向的人剛好人多。想把偏心的人剔掉也會反咬一口:定案反而更不準,還會有一大堆書因為貼紙太少變成不能用。
也有人改用更聰明的算法來合併貼紙,結果多半只多準一點點,偏心也不一定會消失,有時還更糟。等到電腦拿這些「定案貼紙」去學,準度會掉,對不同族群也更不平均。比較有用的做法,是在貼紙定案那一步就把公平一起顧好,別等到電腦上場才補救。