Post doc mise au point d'une méthodologie outillée de localisation d'agents conversationnels vocaux dédiée aux langues sous-dotées F/H
Ref : 0026987 | 19 mars 2020
Date limite de candidature : 16 juil. 2020
2 avenue Pierre Marzin 22300 LANNION - France
Leaflet
Votre rôle
Votre rôle consistera à :
décrire de façon exhaustive la chaîne de traitements à mettre en oeuvre (modules impliqués, données associées) pour produire une suite logicielle d'agent conversationnel vocal de langue subsaharienne ; prioritairement en wolof
proposer un protocole d'acquisition de données
rédiger un livre blanc sur la localisation de technologies langagières à des fins d'interaction homme machine en langue subsaharienne
Contexte:
La « Voice First Revolution » est là, en cours de généralisation dans les grandes langues internationales (anglais, français, espagnol,…). Ceci tient à la révolution de ces dernières années avec l'arrivée des GPU et du Deep Learning en IA et par ses impacts sur les performances des systèmes de reconnaissance des formes, en particulier de reconnaissance vocale. Le changement d'euristique en développement de systèmes de dialogue en langage naturel -maintenant orienté « compétence »- et l'introduction d'un apprentissage basé sur le traitement des intentions pour la compréhension (NLU) est le second facteur de rupture à l'origine de cette « Voice First Revolution ». Maintenant partout disponibles, des agents conversationnels généralistes (Google Home, Alexa, Siri, …) ont pénétré les foyers de plus de 60 pays.
Cette révolution arrive avec un environnement global de développement technologique bien structuré : de nombreuses solutions libres, voire open source, de très bonne qualité et très professionnelles sont disponibles. Spécialisées sur des aspects métiers particuliers (Transcriber, Tensorflow, Rasa, …), ces solutions conjuguées correctement permettent de délivrer un service complet moyennant la disponibilité de données adéquates. Nous reviendrons sur les données.
Mais cette révolution ne concerne in fine que des populations capables d'interagir dans une grande langue internationale. Les populations Africaines qui ne communiquent pas dans une grande langue internationale sont de facto, aujourd'hui, tenues à l'écart des progrès réalisés sur les technologies d'interaction par la parole, modalité d'interaction la plus naturelle. Leurs langues n'ont pas d'existence technologique alors qu'elles sont réputées représenter, selon les sources et les critères, entre 50% et 75% de la population africaine. Ces gens sont privés d'un accès à l'information écrite, ce qui entre en compte dans nombre de nos services.
Nous visons à permettre à ces populations d'accéder à nos services en leur offrant une interaction de type bot vocal dans l'une des langues qu'ils pratiquent. Cela suppose de développer et livrer des briques de traitement langagier (ASR, NLU, TTS, …), chacune dépendante de la langue, bien opérables sur un périmètre de service bien caractérisé. [Voxygen], entreprise technologique dédiée à de la fourniture de systèmes de synthèse vocale, a bien démontré les limites de l'exercice et sa synthèse vocale du wolof est de bonne qualité. Une démarche de localisation pour tirer profit de telles technologies est envisageable.
La problématique des données est le point le plus délicat. Les technologies impliquées aujourd'hui, fondamentalement basées sur de l'apprentissage, nécessitent des données de qualité en quantité significatives, étant donné le nombre d'états qu'il s'agit de modéliser. Mais de telles données, disponibles en masse pour des langues comme le français ou l'anglais, sont rares, voire inexistantes dans les langues subsahariennes. Ce point est très structurant dans l'abord des technologies qui sont normalement très gourmandes en données et il s'agit de travailler sur la définition du besoin, la rareté de l'information contraignant les possibles.
Votre profil
Formation demandée :
Doctorat en Informatique, avec une spécialisation sur le traitement automatique des langues ou de la parole.
Expériences souhaitées (stages, …) :
Une expérience de Recherche sur le tissu langagier subsaharien
Une expérience de Recherche sur l'évaluation de technologies vocales
compétences (scientifiques et techniques) et qualités personnelles souhaitées par le poste
compétences en linguistique computationnelle dédiée aux langues subsahariennes
compétences sur les technologies langagières, en particulier la reconnaissance vocale
compétences avancées en programmation (Python, Bash).
Le plus de l'offre
Objectif scientifique - verrous à lever
Le développement de langues subsahariennes est un exercice difficile tant les données numériques disponibles sont faibles. Les études linguistiques portant sur des langues subsahariennes ne sont généralement que descriptives et partielles. Opérer ces connaissances à des fins technologiques impose de fixer des choix structurants, aux fortes conséquences opératoires. S'appuyant sur la suite logicielle aujourd'hui disponible, il s'agit de décrire méthodiquement un mode opératoire relatif à la localisation de services. La localisation, pour aboutir, a dans les faits des impératifs de disponibilité de données qui diffèrent en fonction des traitements mis en oeuvre. Ainsi un document qui décrirait formellement la chaîne de composants nécessaires - qu'il s'agisse de jeux de données (alphabet, jeu phonétique, corpus textuels ou vocaux, dictionnaires, lexiques, …) ou de modules de traitement (typage des données numériques, POS Tagger, formatages, apprentissages, …) - serait un atout certain pour la conduite de développements impliquant les pays dans lesquels Orange est implanté et il est maintenant pertinent de s'attacher à définir un « Livre Blanc de la localisation des services en Afrique Subsaharienne ».
Recueil ordonné de pratiques et de conduites à tenir, de conseils méthodologiques et d'outils afférant, un tel livrable viserait à éclairer la problématique de la localisation des technologies d'interaction vocale à l'environnement linguistique adéquat. Un travail détaillé en fonction de la gamme de services ciblés permettrait d'une part de chiffrer plus justement les efforts à fournir et d'autre part de présenter clairement les besoins d'accompagnement par les pays destinataires de ces technologies. Ces considérations sont aujourd'hui traitées au cas par cas et uniquement par des experts, selon le besoin. Aucune vue d'ensemble n'est aujourd'hui disponible.
Approche méthodologique-planning
1. Description exhaustive de la chaîne de traitements à mettre en oeuvre (modules impliqués, données associées) - 3 mois
2. Propositions de protocoles d'acquisition de données - 3 mois
3. Mise à disposition d'un libre blanc sur la localisation de technologies langagières à des fins d'interaction homme machine en langue subsaharienne - 6 mois
Entité
Vous intègrerez une équipe projet dédiée à l'interaction langagière en langue subsaharienne, au sein de la nouvelle direction Data & AI. Cette direction a pour principale mission de faire d'Orange une entreprise « data driven », qui définit les standards du Groupe en matière de Data et d'IA, et qui facilite le développement des cas d'usage, des produits et des services de données.
Cette direction est appelée à irriguer l'ensemble du groupe Orange.
Cette offre est une opportunité rare qui permet
de travailler sur le tissu linguistique subsaharien
de travailler à l'adoption des TIC en Afrique subsaharienne par la localisation des services
de travailler directement avec les pays du footprint d'Orange en Afrique subsaharienne
de bénéficier d'un terrain d''expérimentation et de conditions réelles
d'évoluer dans une dynamique de précurseur technologique pour l'Afrique subsaharienne.
Références
[Diallo, 2012] “Harmonisation des langues africaines transfrontalières par les TIC - Cas du Peul”, Ph.D Thesis, Université de Montréal, Canada, 2012
[Lwazi II, 2013] “Lwazi II Final Report, Increasing the impact of speech technologies in South Africa” CSIR, Pretoria, South Africa, 2013
[Gauthier, 2016] “Collecting Resources in Sub-Saharan African Languages for Automatic Speech Recognition: a Case Study of Wolof”, LREC, Elodie Gauthier, Laurent Besacier, Sylvie Voisin, Michael Melese, Uriel Pascal Elingui, 2016