静かなアトリエと、見えない先生
ある静かなアトリエを想像してみてください。そこには一人の見習い画家が、ごちゃごちゃした風景の前に座っています。「これは猫だ」「あれは花瓶だ」と教えてくれる先生はいません。見習いはただ、隣にいる「先輩」が描く絵を参考にして、ひたすらスケッチを続けます。言葉を使わず、見よう見まねで「見る力」を養う不思議な修行です。
この練習には変わったルールがあります。見習いは風景のほんの一部、例えば「猫の耳」のような拡大された細部だけを見ます。一方、先輩はもっと広い範囲を見ています。見習いの目標は、その小さな断片から全体像を想像し、先輩の絵と雰囲気をピタリと合わせること。つまり、一部分から文脈を推測するゲームなのです。
ここで困ったことが起きます。二人が絵を一致させようとするあまり、ズルをしてしまうのです。二人ともキャンバスを真っ黒に塗りつぶしてしまえば、確かに絵は「完全に一致」しますよね。でも、それでは風景のことは何も学べません。コンピューターの世界では、これを「崩壊」と呼び、最も避けたい失敗の一つです。
この「サボり」を防ぐため、先輩の絵に厳しいルールが課されました。まず、ぼんやりした平均的な色を使ってはいけません。そして、常に鋭く、はっきりした線で描くこと。先輩が曖昧さを捨てて描き始めると、見習いもそれに合わせるため、必死に具体的な形を捉えようとし始めます。
実はここで、面白い種明かしがあります。この「先輩」という人物、実は存在しません。先輩の絵だと思っていたものは、見習い自身の過去のスケッチを何枚も重ねて、手ブレをなくしたような「安定版」だったのです。つまり、少し前の自分を先生役にして、自分自身を修正しながら学んでいたわけです。
この孤独な特訓を続けると、不思議な力が目覚めます。名前も知らない物体なのに、その輪郭を完璧になぞれるようになるのです。「これは背景」「これは物体」という区別が、誰に教わらなくても自然に見えてくる。ただ絵を合わせようとした結果、物の形そのものを理解してしまったのです。
これにより、コンピューターは人間のように「物」を認識できるようになります。人間がわざわざ四角い枠で囲って教えなくても、ただ世界を眺めるだけで、そこにある重要な形を自力で見つけ出す。大量の映像データが、意味のある景色へと変わる瞬間です。