Au cœur de Gemini, l’intelligence capable de « raisonnements sophistiqués » de Google

Une allée de supercalculateurs dans un site californien de Google qui permet, entre autres, de faire fonctionner Gemini.  - Credit:Google
Une allée de supercalculateurs dans un site californien de Google qui permet, entre autres, de faire fonctionner Gemini. - Credit:Google

Imaginez un logiciel capable de reconnaître des formes d'objet. En l'occurrence un petit canard en plastique. Jusqu'ici rien de très nouveau. Imaginez maintenant que vous posez ce canard en plastique sur une mappemonde. Le logiciel est capable de localiser l'océan pacifique. Mais lorsque vous demandez au programme si ce petit canard pourra flotter, le programme explique qu'il n'en sait rien. L'utilisateur fait alors couiner le canard, le programme en déduit ensuite qu'il y a de l'air à l'intérieur du canard et que ce dernier sera à même de flotter.

Voici une des caractéristiques de Gemini, le modèle en intelligence artificielle (IA) le plus puissant jamais conçu par Google. Ce dernier sera en effet multimodal, c'est-à-dire capable de traiter et de combiner différents supports d'information : des textes, des sons, des photos, des vidéos, mais aussi du code informatique. Cette adaptabilité, explique Google, est capable de « raisonnements sophistiqués ».

Intégrée dans des téléphones portables

« Depuis longtemps maintenant, nous cherchons à élaborer une nouvelle génération de modèles d'IA qui reflètent la manière dont les humains comprennent le monde et interagissent avec lui : une IA qui ne soit plus simplement perçue comme un logiciel astucieux, mais plutôt comme un allié utile et intuitif. » « Comme un assistant chevronné ou un alter ego », a expliqué Demis Hassabis, le responsable de l'intelligence artificielle de Google, à l'occasion de la présentation.

À LI [...] Lire la suite