IA : l’intelligence par métonymie

Last updated on 18 juin 2025

La favorite du Sultan,
Image générée par Midjourney

Il y a, dans les nombreux procès faits aux IA génératives et autres LLM, une chose jamais dite et qui pourtant joue un rôle important dans le jugement que nous portons sur elles, c’est la vexation qu’elles nous causent. Il n’est pas facile, quand on fait si grand cas de l’intelligence humaine, de constater que ce qui lui ressemble le plus, ce qui peut le plus, au moins de loin, passer pour elle, n’est pas le fruit délicat et subtil d’un supercalculateur faisant tourner des algorithmes fabuleux, mais l’œuvre inattendue d’un regroupement, d’un assemblage hétéroclite de processeurs graphiques entraînés à deviner la suite la plus probable des mots et des pixels qui lui sont donnés en entrée. Aucune intelligence, aucune tentative pour comprendre le sens du propos, la réalité des concepts maniés mais une simple analyse de probabilités, la quête itérative et répétée du mot qui serait statistiquement choisi par un humain pour compléter les mots et pixels précédents.

On tombe de haut. Pendant des dizaines d’années, on a essayé de mettre au point des machines sensibles et intelligentes, capables d’appréhender la réalité du monde, d’en saisir les nuances, susceptibles de raisonner avec des règles, des algorithmes, des déductions tout en finesse ; et on y a parfaitement échoué car ces machines demeuraient bêtes et totalement incapables de répondre à une question qui ne leur avait jamais été posée. Or c’est justement cela : innover, répondre à une question inédite, faire face à l’imprévu que savent faire les grands modèles de langage (LLM), les intelligences artificielles génératives, ces machins décérébrés, ces réseaux neuronaux créant du neuf par imitation, par interpolation, par simple métonymie du réel.

Les LLM ne comprennent rien à ce qu’elles racontent, elles n’ont pas la moindre idée de la nature des images qu’elles génèrent. Elles savent simplement que les mots et les pixels qu’elles alignent à la queue leu leu sont ceux qui, dans le champ lexical ou visuel choisi, ont le plus haut degré de vraisemblance. Elles complètent ce qui précède en tenant compte des milliards d’associations de pixels et de mots que leur entraînement leur a apprises : imitation game.

Le résultat pourrait être une immense cacophonie, un barbouillis infâme et juste bon à mettre à la poubelle mais le miracle est que c’est au contraire à l’issue de ce processus fondamentalement insémantique d’itérations que jaillit quelque chose qui paraît avoir du sens, de la beauté, voire témoigner d’une lueur d’intelligence. Et c’est profondément vexant puisque cela montre que rien ne ressemble plus à notre intelligence, que rien n’est à certains égards plus proche de notre intelligence, que son imitation, y compris dans les applications, notamment médicales et scientifiques, qui ne se contentent pas de singer, mais qui cherchent et découvrent.


L’image d’illustration (très belle mais où la main laisse probablement apparaître beaucoup plus de doigts qu’il n’en faudrait) a été générée par Midjourney sur la base du prompt suivant (toujours moyennement suivi) : « Baghdad, 10th century. The harem, a large room with carpeted walls and floors. Lying simply on a sofa covered with silk fabrics and cushions, her face resting on her hand, the sultan’s favorite, richly adorned and lightly dressed, listens to music, thinking of her childhood in the Caucasus mountains. Close-up of her face turned towards the lens. Amateur natural colour Photography with Leica. »

Et Midjourney générant quatre images pour chaque prompt, voici les trois autres (également très belles) :

En fond musical, derrière ma lecture, « IBM 1402 Card Read-Punch », tiré de l’album IBM 1401, a User’s Manual, de Jóhann Jóhannsson.


En savoir plus sur Improvisations

Subscribe to get the latest posts sent to your email.

3 Comments

  1. […] Là est le lien entre hypnocratie et IA génératives : d’un côté, une réalité politique et stratégique sort de propos et d’actes erratiques ; de l’autre, du sens surgit de la juxtaposition statistique de mots incompris. […]

  2. […] le plus juteux qui soit. Le moment viendra alors d’affronter une question vertigineuse : si l’imitation de l’intelligence par prédiction probabiliste des mots et tokens susceptibles de poursuivre une suite de mots peut, aussi paradoxal que cela […]

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.