La bajada en bici que enseñó a frenar sin perder el control
Bajé una cuesta larga en bici y la velocidad se me fue subiendo sola. Si apretaba el freno de golpe, la rueda podía patinar; si no frenaba, abajo me la jugaba. Probé otra cosa: apretaditas cortas, una y otra vez, para seguir avanzando sin descontrolarme.
Esa misma metida de pata pasa cuando un sistema que aprende cambia su forma de actuar de un tirón. Es como un conjunto de reglas que elige qué hacer y se ajusta según le fue. Si se ajusta demasiado, empeora de repente, como la bici cuando derrapa. Había formas de evitarlo, pero eran pesadas y difíciles de manejar.
La idea nueva fue ponerle un tope sencillo a cada ajuste. El sistema mira cuánto más probable es que elija una acción ahora que antes, y con eso decide cuánto cambiar. Y entonces viene el truco: si el cambio se pasa de una franja pequeña, esa parte extra cuenta como si no valiera la pena.
En la bici, ese cambio de “probabilidad de elegir” se parece al salto de velocidad entre un momento y otro, y el tope se parece a decidir que la maneta solo se mueve un poquito en cada apretón. El mecanismo compartido es el mismo: limitar el paso para no perder agarre. Moraleja: mejor muchos pasos pequeños que un tirón peligroso.
Luego el sistema repasa lo que le pasó hace poco varias veces, como repetir la misma parte de la cuesta. Sin tope, repetir puede tentar a cambios extremos que se ven buenos en ese rato pero salen mal después, como apretar y apretar hasta patinar. Con el tope, cuando ya te pasaste, empujar más no “premia” nada y se queda en mejoras pequeñas.
También existía otra protección: un castigo que crece cuando el comportamiento nuevo se aleja demasiado del viejo, y se iba ajustando sobre la marcha. Eso se siente como un freno que se pone duro cuando aprietas de más. Aun así, el tope simple solía salir mejor, sobre todo cuando la tarea era enredada y era fácil perder el control.
Al final, la bajada se volvió suave: podía apretar el freno muchas veces en el mismo tramo y la bici seguía estable, porque cada apretón no podía volverse un jalón. Con el sistema pasa igual: puede practicar con lo reciente varias veces sin que una sola pasada lo empuje lejos de lo que ya funcionaba.