200 langues traduites par un seul programme : Facebook — désormais Meta — repousse les limites de la traduction automatique par IA

Sciences et Avenir a interrogé Antoine Bordes à propos de ce modèle de traduction automatisée intégrant des langues rares, jusqu'à présent non couvertes par ce type d'algorithme. Le directeur du centre français du laboratoire de recherche en intelligence artificielle (IA) de Meta, anciennement Facebook, explique aussi comment NLLB-200 s'inscrit dans le scénario du métavers.

En traduction de textes automatisée, Facebook — désormais Meta — mène la danse. Le 8 juillet 2022, le géant des réseaux sociaux (qui possède aussi Instagram et WhatsApp) a annoncé avoir mis au point un programme d'intelligence artificielle capable de prendre en charge la traduction de 200 langues. C'est le double du précédent record, détenu par un algorithme de Microsoft. Le modèle numérique de Meta, appelé NLLB-200 (comme "No Language Left Behind", soit "Pas un langage mis de côté"), prend en compte des langues rares comme le lao (parlé au Laos), le kamba, le peul ou le lingala (parlées en Afrique). Pas ou peu intégrées aux précédents logiciels de traduction, elles sont pourtant utilisées par des millions de locuteurs. Pas moins de 45 millions de personnes parlent ainsi lingala en RDC (République démocratique du Congo), République du Congo, République Centrafrique et Soudan du Sud. Pourtant, il n'existe — relève Meta — que 3260 articles de Wikipédia en lingala ; à comparer par exemple avec les 2,5 millions d'articles en suédois, langue employée par "seulement" 10 millions de personnes en Suède et en Finlande ! Voilà bien l'enjeu de NLLB-200 : proposer un meilleur accès aux contenus du Web à des milliards de personnes, qui jusqu'à présent n'y avaient pas accès en raison de la barrière de la langue. Si Meta propose son programme en accès libre, ce qui permet à n'importe quel acteur de s'en emparer, l'entreprise créée par Mark Zuckerberg a un intérêt immédiat à développer ce type de service, Facebook réalisant quotidiennement près de 20 milliards de traductions sur son fil d’actualité... Antoine Bordes, directeur du centre parisien en intelligence artificielle de Meta (FAIR, Facebook Artificial Intelligence Research), laboratoire dont les chercheurs ont été en première ligne pour développer NLLB-200, répond aux questions de Sciences et Avenir sur l'élaboration de ce modèle, aboutissement de six ans de recherche sur la traduction par intelligence artificielle. Et évoqu[...]

Lire la suite sur sciencesetavenir.fr

A lire aussi