Le bureau des objets trouvés qui comprend les mots
À la table des objets trouvés du parc, j’étale une écharpe rouge, une petite voiture, un trousseau, une coque de téléphone. Les gens décrivent vite ce qu’ils ont perdu. Je n’ai pas de liste toute faite, alors je cherche le meilleur match. Les images, c’est les objets. Les phrases, c’est les descriptions.
Avant, c’était comme si la table n’acceptait qu’une feuille avec quelques cases. Si la feuille dit écharpe et clés, et que je tiens une coque de téléphone, je bloque ou je devine. Pareil pour des machines qui ne connaissent qu’une liste de noms choisie à l’avance, et se perdent dès que le monde change.
Le nouveau truc, c’est d’entraîner deux côtés en même temps. Un côté fait une empreinte courte de l’image, l’autre fait une empreinte courte de la phrase. Une empreinte, c’est juste une trace qui garde l’idée principale pour rapprocher ce qui va ensemble. Je m’entraîne avec un énorme tas d’objets et leurs petits mots, pas une petite liste.
À la table, ça devient un jeu de tri rapide. Je regarde plein d’objets et plein de descriptions d’un coup, et je dois trouver le bon duo au milieu de tous les faux amis. Le truc c’est la pression de choisir le bon partenaire encore et encore. Du coup, les empreintes des images et des phrases finissent par se ranger au même endroit.
Un jour, quelqu’un demande un parapluie rayé. Même si parapluie n’était sur aucune feuille, la phrase suffit pour guider mes mains. La machine peut faire pareil avec une étiquette écrite sur le moment. Mais attends, les mots comptent beaucoup: dire photo d’un trousseau est plus clair que clés, alors on essaie plusieurs formulations pour éviter les malentendus.
Ça tient mieux quand les images ne ressemblent pas aux photos habituelles, comme un dessin, une image floue, ou une prise bizarre. Mais pour des demandes qui exigent de compter finement ou de connaître un détail très pointu, je peux me tromper. Et si les notes d’entraînement viennent d’un grand bazar de textes, de mauvaises habitudes peuvent s’y glisser, selon les mots employés.
À la fin de la journée, je vois la différence. La table à cases est propre, mais étroite. La table entraînée avec des tas d’objets et de descriptions accepte une phrase nouvelle et trouve quand même un match raisonnable. Pratique, oui, et ça rappelle aussi qu’il faut choisir ses mots et poser des garde-fous.