فرقة صغيرة على الطريق تهزم التوقعات
كان نشّار الخشب يعلّق في هواء ورشة مسرح صغيرة، والطاقم يحشر ديكورات مسطّحة في شاحنة واحدة. المخرج محتار: يجلب فرقة ضخمة لكل الأدوار، أم فرقة قليلة ويعوّضها ببروفات طويلة ونسخ نصوص من مكتبات عامة وأرشيفات المجتمع.
الناس تتوقع الفرقة الضخمة تفوز، لأن عددًا أكبر يحفظ كلامًا أكثر. الفكرة نفسها عند برامج الكلام: نعتقد أن الأكبر دائمًا أذكى. بس على الطريق، الفرقة الضخمة تكلف أكثر وتتعب في التنقل. الخلاصة: أحيانًا تدريب أطول يغلب الحجم عندما تهمك كلفة العرض.
الطاقم اختار الفرقة القليلة، وفتح باب البروفات على آخره. وبنفس الروح، صُنعت نسخ بأحجام مختلفة من برنامج كلام اسمه LLaMA، ودُفعت النسخ الأصغر لقراءة نصوص عامة لفترة أطول من المعتاد. كانت القراءة من كتابات متاحة للجميع: صفحات ويب منظّفة، موسوعات بلغات كثيرة، كتب، شيفرة، وأسئلة وأجوبة.
البروفات الطويلة لا تنجح إذا صار المكان فوضى. فحطّوا علامات واضحة على الخشبة، وروتينًا ثابتًا، وطريقة كلام لا تضيّع النفس. وفي الخلفية، اتُّخذت قرارات مشابهة كي يتعلم البرنامج بثبات ويعرف أين وصل داخل نص طويل، ومع ترتيب العمل كي يجري أسرع ويستهلك ذاكرة أقل.
ليلة الافتتاح، الفرقة الصغيرة أدّت مشاهد عادة تحتاج فرقة أكبر. وهذا يشبه ما أُعلن عنه: نسخة بحجم 13B تفوقت على نسخة أقدم بحجم 175B في كثير من المقارنات، ونسخة 65B بقيت قريبة من أنظمة قوية دُرّبت بموارد خاصة أكبر. وفي الحساب والشيفرة تتحسن حين تجرّب أكثر من حل ثم تختار الأكثر اتساقًا، مثل إعادة اللقطة.
بعد التصفيق، انتبهوا لشيء مزعج: أحيانًا تخرج جُمل أقسى مع الفرقة الأكبر، وتظهر صور نمطية بلا قصد. وظهر نمط شبيه هنا: قد تزيد الردود المؤذية مع الحجم، وقد يظهر تحيز في الدين وأدوار الجنسين، وقد يقدّم إجابات خاطئة بثقة. الفارق الذي بقي واضحًا: يمكن لنسخة أصغر أن تقوى بقراءة عامة أطول فتقل كلفة تشغيلها، لكن الأمان والصدق يحتاجان عناية مقصودة.