Comment essayer Moshi, l’assistant vocal de Xavier Niel qui répond aussi vite qu’un humain ?

En mai 2024, avec la nouvelle version de ChatGPT Voice alimentée par le modèle GPT-4o, OpenAI présentait au monde la première intelligence artificielle capable d’analyser la voix en temps réel. Plus besoin de transformer un son en un texte écrit (c’est de cette façon que fonctionnent Siri ou Google Assistant), les modèles de demain seront capables de reconnaître directement des bruits et de deviner ce que vous allez dire ensuite, quitte à aller plus vite que le cerveau humain. Pris dans différentes polémiques (dont l’imitation de la voix de Scarlett Johansson), OpenAI a repoussé la sortie du nouveau ChatGPT Voice à l’automne.

Et puis, par surprise le 3 juillet, le laboratoire français Kyutai a dévoilé son propre modèle vocal, baptisé Moshi. Lui aussi peut répondre à la voix en temps réel, grâce à une capacité d’analyse native de la voix. Moshi, qui est un projet open source à but non commercial, est disponible en test sur le site de Kyutai. Pour rappel, il s’agit d’un laboratoire fondé notamment par Xavier Niel, qui rêve de rivaliser avec les géants américains et chinois.

Comment essayer Moshi dès aujourd’hui ?

[Lire la suite]

Crédits photos de l'image de une : Moshi Chat. // Source : Kyutai