عندما يرى الحاسوب نصف الصورة

تخيل أننا في بروفة مسرحية، ومسؤول الإضاءة في ورطة مع كشاف "ذكي". كلما دخل الممثل، يقفز الضوء ليركز بقوة على مشبك حزامه اللامع ويترك وجهه في الظلام. الآلة تظن أن النقطة الأكثر لمعانًا هي الوحيدة المهمة، فتضيع ملامح الممثل تمامًا.

هذه المشكلة تشبه تمامًا كيف تشرح بعض أنظمة الذكاء الاصطناعي ما تراه. عندما تنظر لصورة كلب، قد تركز فقط على طرف أذنه الحاد لأنها "الأوضح" رياضيًا. باقي التفاصيل كالفرو والذيل تبقى غير مرئية، وكأن النظام يحزر بناءً على تلميح صغير بدلاً من رؤية الحيوان كاملًا.

لإصلاح ذلك، عدّل الفريق طريقة توزيع "الضوء". النظام القديم كان يسمح لنقطة واحدة ساطعة بإلغاء كل ما حولها. الطريقة الجديدة تشبه استخدام مفاتيح خفوت مستقلة؛ فهي تسمح للتفاصيل المهمة أن تضيء بوضوح متوسط بدلاً من طمسها، لتظهر الصورة أشمل.

تغير المشهد على المسرح فورًا. بدلاً من بقعة ضوء ضيقة وقاسية، انتشر الضوء بنعومة ليكشف وجه الممثل ووقفته والأدوات التي يحملها. لم نعد نرى مجرد نقطة لامعة عشوائية، بل ظهر الشكل المتصل والكامل للشخصية بوضوح.

هذه الرؤية الشاملة تغير ثقتنا في الآلة. عندما نرى التفاصيل المتوسطة والناعمة، نتأكد أن الذكاء الاصطناعي لا يتفاعل مجرد صدفة مع بقعة لون، بل يدرك شكل الجسم فعليًا. هنا يتحول التخمين الغامض إلى قرار مرئي ومفهوم.