نزول بالدراجة بلا انزلاق: سر التعلّم الهادئ
كنت أنزل بدراجتي من تل طويل، والسرعة تزيد شيئاً فشيئاً. شدّة واحدة قوية على الفرامل قد تجعل العجلة تنزلق، وتركها تماماً قد ينتهي بارتطام أسفل الطريق. جرّبت عادة أهدأ: ضغطات صغيرة متكررة تبقيني قريباً من سرعة آمنة وأنا ما زلت أتقدّم.
تذكّرت أن بعض الأنظمة التي تتعلّم تعمل هكذا: تختار تصرّفاً، ثم تغيّر قواعدها حسب ما نجح وما فشل. المشكلة تظهر حين تغيّر نفسها دفعة كبيرة، فتسوء بسرعة، مثل شدّة مفاجئة على الفرامل تقلب نزولاً ثابتاً إلى انزلاق. كانت هناك حلول تمنع القفزات، لكنها ثقيلة ومزعجة.
الفكرة الجديدة كانت مثل محدّد بسيط للضغط على الفرامل. النظام ينظر: هل صار يميل لاختيار التصرّف نفسه أكثر من قبل أم أقل؟ ثم يقرّر مقدار التغيير. اللمسة المهمة أن هناك سقفاً صغيراً، فإذا حاول التغيير تجاوز الحد، لا يحصل الجزء الزائد على فائدة كأنه لم يحدث.
هنا صار التشبيه واضحاً. مقدار تغيّر ميل النظام لاختيار التصرّف يشبه قفزة السرعة بين لحظة وأخرى. والسقف يشبه قراراً أن مقبض الفرامل لن يتحرك إلا ضمن مدى صغير في كل ضغطة. الفكرة المشتركة هي أن الخطوة الواحدة لا تُسمح لها أن تكبر حتى لا تفقد العجلة تماسكها. والخلاصة: تقدّم، لكن بخطوات لا تجرّك للانزلاق.
وأثناء العمل، يجمع النظام خبرة قريبة ثم يراجع الخبرة نفسها مراراً، ويعدّل في كل مرة تعديلاً صغيراً. من دون سقف، التكرار قد يغريه بتغييرات متطرفة تبدو جيدة للحظة ثم تفسد بعدها، مثل شدّات متتابعة على الفرامل. مع السقف، حين يكبر التغيير أكثر من اللازم، يتوقف كسبه، فيبقى التحسّن صغيراً ومفيداً.
كان هناك أداة أمان أخرى تشبه فرامل تدفع عكسك كلما ضغطت أكثر، ويحاول السائق ضبطها أثناء النزول. لكنها كانت تتعب صاحبها. غالباً ما كان السقف البسيط على التغيير أهدأ وأثبت، خاصة حين تكون المهمة صعبة والنظام قابل لأن يندفع بعيداً عن الطريق الصحيح.
في نزولي، عدت أضغط ضغطات صغيرة كثيرة في المقطع نفسه، وبقيت الدراجة مستقرة بدل أن تتلوّى. الفارق كان واضحاً: من دون حد قد تتحول ضغطة واحدة إلى شدّة خطرة، ومع الحد تبقى كل ضغطة معقولة. وبالمثل، هذا السقف يسمح للنظام أن يستفيد من الخبرة نفسها مرات عدة من غير أن يدفع نفسه فجأة بعيداً عمّا كان يعمل.