Quand la machine apprend à bricoler
Imaginez un randonneur coincé dans un canyon étroit par un énorme rocher fraîchement tombé. La carte dit d'aller tout droit, mission impossible. Au lieu d'abandonner, il noue sa corde de tente à son bâton pour fabriquer un crochet. C'est exactement ainsi que les nouvelles intelligences artificielles apprennent à se sortir d'une impasse avec les moyens du bord.
Pendant des années, les programmes informatiques fonctionnaient comme un voyageur incapable de quitter sa carte des yeux. Si une machine croisait un obstacle imprévu, elle se figeait et affichait une erreur. Le truc, c'est qu'elle ne voyait les objets que selon leur définition stricte. Un bâton n'était fait que pour marcher, impossible d'imaginer un autre usage.
Pour corriger ce blocage, les ingénieurs changent la façon dont les machines perçoivent le monde. Désormais, le système ne se contente plus de l'étiquette d'un bâton de marche. Il apprend ses propriétés physiques, comme sa longueur et sa rigidité. Du coup, la machine gagne la souplesse nécessaire pour voir les objets du quotidien comme des matériaux à bricoler.
Maintenant, quand le système bute sur un mur, il fouille dans ses connaissances pour inventer une issue. Il peut combiner des choses qui n'ont rien à voir, tout comme notre randonneur avec sa corde et son bâton. Parfois, il détourne complètement un objet de sa fonction première, en comprenant par exemple qu'une grosse pierre peut très bien servir de marteau.
Mais attends, cette capacité d'improvisation va plus loin que la simple fabrication d'outils. La machine trouve aussi comment modifier son environnement direct. Elle pourrait empiler des pierres pour créer un escalier, ou bien adapter son propre comportement en découpant un grand saut dangereux en plusieurs petits mouvements d'escalade beaucoup plus sûrs.
La prochaine étape consiste à aider ces systèmes à mémoriser leurs bonnes idées. Tout comme un voyageur aguerri retient les leçons d'un trajet difficile, la machine pourra utiliser ses vieilles astuces face à de nouveaux dangers. Le changement est flagrant. On passe d'un outil qui panique dès que la carte s'arrête, à un compagnon capable d'inventer son propre chemin.