Après ChatGPT, les “world models” veulent apprendre aux IA à comprendre le monde

Par Julien Perez (*) —

Après les IA capables de générer du texte ou des images, une nouvelle génération de modèles cherche à donner aux machines une représentation interne du réel. Objectif : leur permettre d’anticiper les conséquences de leurs actions, comme nous le faisons instinctivement avant de traverser une rue ou de rattraper une balle.

Imaginez un enfant qui, après avoir vu une balle rouler derrière un canapé, sait instinctivement qu’elle continue d’exister et peut anticiper l’endroit précis où elle réapparaîtra. Cette capacité fondamentale, que la psychologie appelle la permanence de l’objet, constitue un socle de l’intelligence humaine. Nous ne nous contentons pas de réagir aux images qui frappent notre rétine ; nous simulons en permanence le futur dans notre esprit. Aujourd’hui, l’intelligence artificielle tente de franchir ce cap décisif.

Après l’ère des modèles capables de générer du texte, comme ChatGPT, ou des images, comme Midjourney, une nouvelle frontière se dessine avec les world models (“modèles de monde”). L’enjeu est de taille : il s’agit de doter les machines d’une forme de sens commun physique, spatial et logique pour qu’elles cessent d’imiter… et commencent enfin à comprendre.

  Lire Plus