La troupe minuscule qui apprend plus vite que la troupe géante
Dans l’atelier du théâtre, la sciure flotte encore. On doit tout faire tenir dans un seul camion. Le metteur en scène hésite, grosse troupe pour tout jouer, ou petite troupe et des nuits de répétitions avec des piles de textes empruntés partout.
Tout le monde parie sur la grosse troupe, plus de têtes, plus de répliques. C’est comme croire qu’un gros assistant de texte, avec plus de boutons à régler dedans, sera forcément meilleur. Mais sur la route, ça coûte cher et ça ralentit. Parfois, mieux vaut répéter plus que grossir.
Ils choisissent la petite troupe et ils répètent, encore et encore. Dans le même esprit, l’équipe LLaMA a fait plusieurs assistants, du petit au grand, et a fait lire aux plus petits bien plus de textes que d’habitude. Un mélange public, surtout des pages web nettoyées, mais aussi des encyclopédies, des livres, du code et des forums.
Pour tenir ce rythme, l’atelier devient carré. Marques au sol, routines qui évitent les ratés, dialogues qui ne gaspillent pas le souffle. LLaMA a aussi réglé des détails pour rester stable, garder le fil sur de longs passages, et accélérer l’entraînement en évitant des calculs refaits et en répartissant le travail sur beaucoup de machines.
Le soir de la première, la petite troupe réussit des scènes qu’on confie d’habitude à une armée. Dans les comparaisons, un LLaMA moyen dépasse souvent un ancien géant, et le plus grand tient tête à des systèmes très connus. En maths et en code, il progresse quand il tente plusieurs pistes et garde la plus cohérente, comme plusieurs prises.
Après les applaudissements, ils écoutent les dérapages. Avec plus de monde, certaines répliques sortent plus dures, et des clichés reviennent sans qu’on les ait invités. LLaMA montre aussi ça, plus il grossit, plus des sorties toxiques et des biais peuvent monter, et il peut répondre faux avec aplomb. Mais il prouve qu’on peut viser fort sans payer le prix d’un géant à chaque phrase.