Project Astra : Google répond à ChatGPT-4o avec un assistant capable de parler et de voir

Quelques minutes avant qu’OpenAI présente la nouvelle version de ChatGPT Voice, capable de parler naturellement, de changer de ton et de commenter des images en temps réel grâce au modèle GPT-4o, Google a publié la vidéo d’une application inconnue, capable de parler et de voir grâce à l’appareil photo d’un smartphone.

24 heures plus tard, cette application a un nom. Développée par DeepMind, le laboratoire de recherche de Google, « Project Astra » est une démonstration « du futur des assistants IA » basé sur le modèle Google Gemini. Il peut, lui aussi, commenter le monde en temps réel.

Google contre OpenAI : le projet Astra est-il aussi abouti que ChatGPT Voice ?

Sans surprise, le projet Astra est la vedette de la Google I/O, la grande conférence de Google largement dominée par l’intelligence artificielle générative en 2024.

Il prend la forme d’une application Android à l’interface très simple. Un bouton permet d’activer la caméra, un autre de dessiner pour entourer un objet. Le reste se fonde sur une interaction vocale continue entre l’humain et Gemini, qui nous rappelle la première démo du modèle de langage fin 2023 (qui était, rappelons-le, truquée).

L'interface du Project Astra.
L'interface du Project Astra.

L’interface du Project Astra. // Source : Google

Comme ChatGPT Voice,

[Lire la suite]

Crédits photos de l'image de une : Le projet Astra de Google répond à OpenAI avec Gemini. // Source : Google