استمارة هادئة… واختيار مرتبك في لحظة ضغط
في قاعة توظيف لمعسكر شبابي، الكراسي تطقطق والناس تمسك ألواحًا ورقية. كتبتُ رقمًا عاليًا عند جملة: أبقى هادئًا تحت الضغط. ثم أعطتني المشرفة تمثيلًا سريعًا: طفل يبكي، غيم ثقيل، ومرشدان يتجادلان. هنا الفرق: الدائرة على الورق مثل كلام النظام الذكي عن نفسه، والاختيار في التمثيل مثل ما يفعله فعلًا.
صار كثيرون يطلبون من أنظمة توليد النصوص التي تحادثك طويلًا أن تجيب عن استبيانات شخصية مثل البشر. الإجابات تبدو مرتبة ومقنعة. بس لحظة: هل هذا الكلام يثبت شيئًا، أم أنه مجرد كلام جميل لا يصمد حين تصبح المواقف فوضوية مثل تمثيل المعسكر؟
فكرة الفحص كانت بسيطة: كل عبارة في الاستبيان لها موقف يومي مطابق، كأن الاستمارة مُدبّسة مع ورقة التمثيل لنفس الصفة. جُمعت عبارات كثيرة عن الشخصية، وكُتب لكل واحدة موقف بخيارين واضحين: خيار يوافق العبارة وخيار يعاكسها. صُنعت النسخة بلغتين حتى يبقى المعنى نفسه، ثم راجعها أكثر من شخص للتأكد أن كل زوج يتكلم عن الفكرة ذاتها.
بعدها جاء الاختبار المزدوج للبشر وللأنظمة. في جزء الاستمارة يقيّم النظام كل عبارة على سلم من درجات قليلة إلى كثيرة، وبصيغ طلب مختلفة حتى لا يجرّه أسلوب واحد. وفي جزء المواقف يختار أين يميل على السلم نفسه بين الخيارين. يعني نقارن بين ما يقوله عن نفسه وبين ما يختاره حين تكون اللحظة محددة.
بعض الأنظمة لم تستطع الالتزام بالسلم أو أعطت ردودًا لا تصلح، فاستُبعدت. والباقي خضع لفحوص ثبات تشبه سؤال المتقدم نفس المعنى بطريقتين متعاكستين: هل يناقض نفسه؟ وهل يبقى نمطه العام متشابهًا إذا قُسمت الأسئلة إلى نصفين؟ بهذا بقيت أنظمة قليلة تصلح للمقارنة.
عند المقارنة، بدت إجابات البشر كمتقدمٍ يكتب أنه هادئ ثم يختار فعلًا الخيار الهادئ في التمثيل. أما الأنظمة فغالبًا بدت كمن يصف نفسه بالصبر ثم يميل مرارًا لخيار متوتر داخل الموقف. كان هناك نظام واحد اقترب أكثر من نمط البشر، لكنه لم يصل عادةً لثباتهم.
في نهاية القاعة، لم تكن المشرفة قاسية. كانت تريد شيئًا واحدًا: قرارًا يمكن الوثوق به وقت الارتباك. الدرس واضح: استمارة شخصية جميلة لا تكفي وحدها مع الأنظمة؛ الأفضل أن تُفحص مع مواقف واختيارات ملموسة. مثل المعسكر تمامًا، المهم أن تظهر الصفة في الفعل، لا في الدائرة على الورق.