J'avais écrit "Le chat mange la souris qui dort près de la fenêtre rouge" sur une bande de papier.
Romane a souligné "rouge". Parce que c'est sa couleur préférée et que le mot lui semblait important. Meryl a souligné "fenêtre" parce que c'est le plus long.
Moi j'aurais souligné "mange" et "dort". Parce que ce sont les actions.
On avait tous les trois raison. Et c'est là que ça devenait compliqué.
Ce que l'IA fait avec une phrase
Quand une IA lit une phrase, elle ne lit pas les mots un par un dans l'ordre, comme on lit un livre. Elle essaie de comprendre quels mots sont importants pour comprendre les autres.
Dans "Le chat mange la souris", le mot "mange" change tout. Si on le retire, la relation entre le chat et la souris disparaît. L'IA apprend à repérer ces mots-pivots. Elle leur accorde plus d'attention qu'aux autres.
Ce mécanisme s'appelle l'attention. C'est l'une des idées centrales derrière les IA modernes. Chaque mot regarde les autres mots de la phrase et décide combien ils comptent pour lui.
L'activité
On prépare à l'avance une dizaine de phrases sur des bandes de papier. Des phrases simples, des phrases ambiguës, des phrases longues. Par exemple :
- "Paul a donné le livre rouge à Marie avant de partir"
- "Le chien qui aboie ne mord pas toujours"
- "Romane a oublié son manteau vert dans le bus jaune"
Chaque joueur reçoit un feutre d'une couleur différente.
Consigne : souligne les trois mots les plus importants de chaque phrase. Sans expliquer pourquoi, dans un premier temps.
Quand tout le monde a souligné, on compare. Les mêmes mots reviennent-ils ? Qui a souligné quoi ? Pourquoi ?
Deuxième temps : pour chaque désaccord, on essaie de construire une règle. "Les mots importants, c'est quoi exactement ?" Actions ? Noms ? Mots rares ? Mots sans lesquels la phrase ne veut plus rien dire ?
Troisième temps : on teste les règles sur de nouvelles phrases. Est-ce qu'elles tiennent ?
Ce qui s'est vraiment passé
Romane soulignait les mots qu'elle trouvait beaux. "Fenêtre" revenait souvent. "Violet" aussi, dès qu'il apparaissait. Sa règle implicite était esthétique.
Meryl avait une règle de longueur. Les mots courts, pour lui, étaient moins importants. "Le", "la", "un" ne méritaient pas d'être soulignés. Ce qui n'est pas complètement faux.
Quand j'ai souligné "a donné" dans la phrase sur Paul et Marie, Romane a protesté. "C'est pas intéressant, 'a donné'." J'ai retiré le verbe de la phrase à voix haute : "Paul le livre rouge à Marie avant de partir." Elle a réfléchi. "Ah. On comprend plus ce qui se passe."
C'est le mot qui fait tenir la phrase. Pas le plus beau. Pas le plus long. Celui sans lequel les autres flottent.
On a essayé de construire une règle ensemble. Elle a mis dix minutes à émerger, approximativement : les mots importants sont ceux qui relient les autres ou qui changent tout si on les enlève. Romane l'a formulé comme ça : "C'est les mots-colle."
J'ai dit que les chercheurs qui ont inventé le mécanisme d'attention dans les IA avaient passé des années à essayer de formaliser exactement cette intuition.
Elle a haussé les épaules. "Ils auraient pu demander à un enfant."
Pour finir
Les bandes de papier sont restées sur la table. Ce soir, Meryl en a pris une et a essayé de construire une phrase où tous les mots seraient également importants.
Il n'y est pas arrivé. Je ne suis pas sûr que ce soit possible.
Est-ce qu'une phrase où tous les mots comptent pareil a encore un sens ?