Machine à exclure ? La reconnaissance vocale au défi des langues régionales

·2 min de lecture

La recherche vocale en ligne est un dispositif de communication par la voix qui permet de donner des ordres à une tablette, un smartphone ou à un assistant personnel virtuel. Cette technologie est en train de s'imposer dans le monde entier, mais certaines communautés linguistiques craignent d'en être exclues.

Bien que le web puisse paraître très inclusif, il ne l’est peut-être pas autant que ça. Actuellement, un peu moins de 50 % de la population mondiale vit toujours sans possibilité de connexion à internet. Par ailleurs, les économies émergentes et les communautés linguistiques marginalisées sont souvent les dernières à y avoir accès. C’est la raison pour laquelle la fondation Mozilla a lancé Common Voice, un projet de financement participatif sur un site dédié pour créer une base de données gratuite permettant de développer des logiciels de reconnaissance vocale afin de défendre un web qui serait accessible et ouvert à tous.

Alimenter le système en données vocales

Concrètement, Common Voice a lancé une initiative qui invite les internautes à faire don de leurs données vocales. L’objectif de cette opération est de développer différents services de transcription automatique de la parole offrant ainsi une alternative aux Siri, Alexa, Google Home, qui, comme bien d’autres dispositifs high-tech conversationnels, sont gérés exclusivement par de grandes firmes américaines. « Nous comptons collecter jusqu’à 10 000 heures de voix dans toutes les langues existantes », précise la fondation sur son site qui conseille aux internautes de proposer une diversité de données vocales en parlant le plus naturellement possible sans chercher à masquer un accent ou les intonations familières propres à nos conversations.

Pour mener à bien son projet, la fondation a besoin des données de voix de femmes, d’hommes, d’enfants, de personnes âgées, afin de recueillir toute la diversité et la richesse d’une langue. Le fait d’avoir plusieurs tonalités de voix permettra d’humaniser les appareils vocaux, estime Mozilla qui rappelle que ces données vocales sont entièrement « anonymisées » avant de les mettre à disposition des jeunes pousses, centres de recherche linguistiques, et même à ses propres ingénieurs informatiques chargés de développer de futures applications de reconnaissance vocale sur son navigateur internet.

Une voix pour rompre l'isolement

Pour bien comprendre l'enjeu de cette technologie, il faut souligner qu'en ces temps de pandémie, la voix a le vent en poupe par rapport à l'écrit ou au tactile favorisés jusqu'à présent dans les usages numériques. Podcasts, vocalisation des messages instantanés, robots conversationnels et réseaux sociaux pour discuter à plusieurs ont permis de briser un peu l'isolement qu'imposent les confinements à répétition.

En définitive, c’est toute une nouvelle communication électronique basée principalement sur l’audio qui est en train de naître. À la condition toutefois que les systèmes de la reconnaissance vocale comprennent enfin les subtilités de votre langue maternelle quelle qu’en soit son origine, ses accents ou encore la rareté de son usage.