Toutes les vidéos dans cet article ont été générées par Sora

C’est indéniablement une nouvelle claque stupéfiante dans le domaine de l’intelligence artificielle. Déjà connue dans le monde entier pour avoir lancé le fameux agent conversationnel ChatGPT, l’entreprise américaine OpenAI a créé la surprise dans la soirée du 15 février avec la présentation de Sora, son modèle de génération de vidéos.

Sora ou le « ChatGPT de la vidéo »

Avec Sora, OpenAI ajoute une nouvelle corde à son arc. Dans le domaine de la génération du texte, on connaissait déjà ChatGPT. Du côté du dessin et de la peinture, on peut compter sur Dall-E. Des projets plus expérimentaux ont aussi existé, comme MuseNet, un outil de création musicale, ou Whisper, pour retranscrire de la voix en texte.

Sora a une capacité multimodale : il transforme du texte et de l’image en vidéo. La durée actuelle de chaque séquence générée atteint la minute. Ces scènes incluent, selon OpenAI, « des scènes très détaillées, des mouvements de caméra complexes et de multiples personnages aux émotions marquées. »

D’après l’entreprise, Sora peut développer des vidéos pour des écrans de grande taille, en 1920 par 1080 pixels, des vidéos verticales en 1080 par 1920 pixels, et tout ce qui se trouve entre ces deux formats. Sora peut ainsi « créer du contenu pour différents appareils directement compatible avec leur format d’origine. ».

Un papier de recherche accompagne l’annonce de Sora,

[Lire la suite]

Crédits photos de l'image de une : Sora, l'IA qui transforme du texte en vidéo // Source : OpenAI