Cette IA a appris à regarder le monde à travers les yeux d’un bébé

Que peut un bébé de 6 mois apprendre à une IA ?
NYU’s Center for Data Science. Que peut un bébé de 6 mois apprendre à une IA ?

INTELLIGENCE ARTIFICIELLE - Comment fait-on pour apprendre ce qu’est un ballon, ou une tasse ? À partir de l’âge des mois, les enfants commencent à prononcer leurs premiers mots, sans pour autant savoir ce qu’est le langage. Beaucoup de scientifiques tentent de percer ce mystère de l’apprentissage. Mais grâce à une étude publiée ce jeudi 1er février sur la revue Science, la réponse à cette question vient de faire un grand pas, et c’est l’intelligence artificielle qui a fourni la clef.

En utilisant seulement les images et les sons aperçus par un bébé, les chercheurs ont voulu tester si l’IA pouvait apprendre à « parler », avec des résultats surprenants. Pour ce faire, les chercheurs n’ont utilisé ni Chat GPT, ni un autre de ses cousins nourri des milliards de gigas octet du web. Il fallait utiliser un système le plus similaire possible au cerveau d’un enfant.

Or, un être humain, et surtout un bébé, ne peut absorber qu’une toute petite partie de ces connaissances. C’est pourquoi les chercheurs ont fait absorber à leur IA une bouillie très similaire à celle reçue par le cerveau d’un petit enfant : des mots répétés, répétés encore… En tout 250.000 « instances » c’est-à-dire des sollicitations, souvent en répétant en poignée des mêmes mots qu’entendrait un nourrisson. Mais ce n’est pas du tout.

Les chercheurs ont également placé une caméra sur la tête d’un bébé, pour que l’intelligence artificielle puisse réunir les mêmes informations que lui. L’IA a donc accompagné fidèlement Sam, un bébé australien, de l’âge de 6 à 25 mois, deux heures par semaine, dans sa découverte du monde. Le système a eu accès seulement aux images et aux sons que l’enfant avait vus et entendu dans le parc, à table, lorsqu’il jouait ou lisait. Bref, le monde observé et écouté du point de vue de Sam.

Des concepts simples, mais plus de difficulté sur les catégories génériques

À la fin de l’expérimentation, les chercheurs l’ont alors soumis à un test, où il devait désigner l’objet indiqué par son nom parmi quatre images similaires. À leur plus grande surprise, le système avait pu apprendre les mots correspondants à une grande partie des objets indiqués, avec un taux de réussite de 62 %.

Le modèle d’IA avait pu réunir tous les moments où il avait entendu le même mot et faire le lien avec l’objet récurrent en analysant les traits communs dans les images. Dans le cas d’un ballon par exemple, c’était toujours le même élément sphérique, malgré une couleur différente. Et tout cela sans savoir vraiment ce qu’est une sphère, ni une forme.

Il avait même pu intégrer le concept de « chien » et « chat », en les reconnaissant dans des photos qu’il n’avait jamais vu auparavant. Ces résultats montrent que pour apprendre à utiliser les éléments de langage basiques, des concepts simples et précis peuvent être appris sans user de techniques d’apprentissage très complexes.

Quant aux catégories plus génériques et larges, comme les jouets, le taux de précision se révélait beaucoup moins exact. Le prochain pas sera probablement de faire interagir l’intelligence artificielle avec les objets, car les enfants reçoivent beaucoup d’informations avec leurs mains et leur bouche. Cela pourrait peut-être impliquer un tout petit robot-enfant, apprenant comme nous.

À voir également sur Le HuffPost :

Ariane 6 arrive (très) en retard face à SpaceX, mais elle a un sacré atout dans sa manche

Sur TikTok, cette tour Eiffel qui brûle fait un carton (mais pas forcément parce qu’on y croit)