Choses A Savoir Tech

Pourquoi Yann LeCun mise-t-il sur les “world models” plutôt que sur les LLM ?

Informações:

Sinopsis

Depuis quelques années, l’intelligence artificielle est dominée par les LLM, les “Large Language Models”, comme ChatGPT ou Gemini. Ces modèles sont entraînés sur des quantités gigantesques de textes afin d’apprendre à prédire le mot suivant dans une phrase. Autrement dit, ils sont extrêmement performants pour manipuler le langage. Mais pour certains chercheurs, dont Yann LeCun, cette approche possède une limite fondamentale : ces systèmes apprennent surtout un modèle du langage, pas un modèle du monde réel. Un LLM peut donc produire des phrases plausibles, répondre à des questions ou écrire un essai. Mais il ne comprend pas réellement la réalité physique qui se cache derrière ces mots. Par exemple, il peut expliquer comment préparer un café, mais il ne sait pas vraiment comment manipuler les objets dans une cuisine ni prévoir ce qui se passerait si un robot exécutait ces actions. C’est précisément là qu’intervient l’idée des world models. Un world model est un système d’intelligence artificielle qui