Votre rôle
Votre rôleest d’effectuer un travail de thèse sur:Compréhension automatique de la parole multilingue pour les langues d'Afrique subsaharienne.
Contexte global et problématique du sujet
Orange est présent dans 14 pays en Afrique subsaharienne et souhaite mieux communiquer, mieux informer et améliorer l’accès à ses services pour les clients de cette zone. Cependant, seule une minorité maîtrise la lecture et l'écriture du français ou de l’anglais, écartant de facto la majeure partie de la population africaine des technologies numériques et des facilités qu’elles apportent, car elles sont basées sur la compréhension de l'écrit. L'accès par la voix peut être une solution, mais les technologies vocales sont encore essentiellement développées dans les principales langues internationales, et non pas dans des langues africaines. Bien que la recherche sur le développement de ces technologies progresse, des stratégies doivent être mises en place afin de trouver la façon optimale, pour Orange et ses filiales, de communiquer avec ses clients dans leurs langues.
Cette thèse s’attachera à mettre en lumière ces stratégies, à travers des méthodes innovantes et disruptives d’apprentissage machine. La ou le candidat sélectionné.e développera des modèles de compréhension de la parole nécessaires au développement de technologies d’interaction vocale. Les approches « bout-en-bout » seront privilégiées, du fait de leur efficacité face aux approches en cascade. Toutefois, cette approche requiert un volume important de données annotées, quantité non disponible s'agissant de langues quasi exclusivement utilisées dans des contextes oraux. Il sera donc nécessaire de trouver des méthodes pour pallier ce manque. Par ailleurs, se passer de ce type de données présente d’autres avantages : les données textuelles ne reflètent pas l’usage oral de la langue. Ainsi, baser l’apprentissage des modèles de parole sur des ressources écrites ou des lectures de textes peut mener à certaines problématiques, comme une mécompréhension de la requête de la part du système ou encore une évaluation des systèmes qui peut être biaisée par les concepts sous-jacents de l’écriture. D’autre part, l’utilisation de corpus textuels entraîne la perte d'informations paralinguistiques et suprasegmentales présentes dans le support vocal. Enfin, l'alternance codique, fréquente dans ces langues, est également peu prise en compte dans les modèles actuels, en raison de faible présence dans les documents écrits. Ainsi, des stratégies visant à réduire au maximum la dépendance aux annotations seront mises en œuvre pour surmonter le manque de données et renforcer la robustesse du système face aux variations linguistiques.
Objectif scientifique – résultats et verrous à lever
L’objectif de la thèse estde résoudre des tâches de compréhension de la parole, adaptées à la zone subsaharienne, en proposant des stratégies innovantes et différenciantes pour adresser le multilinguisme et la rareté des données.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.