La descente qui apprend à rester sage
Je descends une longue pente à vélo, et la vitesse monte toute seule. Si je serre le frein d’un coup, les roues peuvent glisser. Du coup je fais de petites pressions, encore et encore, pour rester à une vitesse tranquille.
Le même souci arrive quand une machine essaie de s’améliorer. Elle choisit une action, voit si ça marche, puis change sa façon de choisir. Si elle change trop d’un seul coup, elle peut partir de travers, comme un frein tiré trop fort.
Le truc nouveau, c’est une petite barrière dans le changement. La machine regarde si elle est sur le point de choisir une action beaucoup plus, ou beaucoup moins, qu’avant. Si l’écart dépasse la barrière, elle fait comme si le surplus ne comptait pas.
Sur le vélo, c’est comme décider que le levier ne bougera jamais trop à chaque pression. Le saut dans les choix de la machine ressemble au saut de vitesse entre deux instants. Même idée partagée, limiter un pas trop grand pour garder l’adhérence, et garder le contrôle.
Elle peut aussi repasser plusieurs fois sur les mêmes souvenirs récents pour s’ajuster petit à petit. Sans barrière, ces repasses donnent envie de forcer, ça semble bon sur le moment, puis ça casse ailleurs. Avec la barrière, pousser plus loin ne rapporte plus, alors elle reste prudente.
Il existe une autre sécurité, une sorte de rappel à l’ordre qui devient plus dur quand la machine s’éloigne trop de son ancien comportement, et qu’on essaie d’ajuster ce rappel en route. Mais la barrière simple tient souvent mieux, surtout quand la tâche est délicate.
En bas de la pente, je réalise que je n’ai pas eu besoin d’un geste héroïque, juste de petites pressions qui ne deviennent jamais un coup de panique. La machine, elle, peut réutiliser les mêmes souvenirs et progresser sans qu’une seule tentative la fasse dérailler.