Ingénieur(e) de recherche NLP (CDI) - junior
Rattaché(e) directement au directeur de recherche pour renforcer l’équipe de R&D spécialisé dans les technologies du Traitement Automatique du Langage Naturel et de la Représentation des Connaissances, nous sommes à la recherche d’un(e) ingénieur(e) de recherche dans ces domaines.
Vous serez aussi en relation avec l’équipe de développement.
Le poste proposé est sous forme de CDI disponible dès maintenant. Les bureaux se situent à Jacou (agglomération de Montpellier) juste au-dessus des Halles du 610. Ces locaux appartiennent au groupe India Juliet qui réunit ses deux sociétés dans ces locaux (Emvista et Penbase). Du télétravail partiel est possible (déjà mis en place chez Emvista).
Mission principale :
* Contribution à la recherche et au développement des briques technologiques déjà existantes chez Emvista (parsing, normalisation, reconnaissance d’entités nommées, analyse d’opinions/émotions, résumé automatique, extraction de mots clés, génération de concepts, agent conversationnel, etc.)
* Veille et état de l’art dans le domaine du NLP
* Évaluation des solutions NLP (académiques et industrielles)
* Encadrements d’étudiants (stagiaires, doctorants, etc.)
* Publications scientifiques (articles dans des conférences et journaux nationaux et internationaux, participation à des workshops, etc.)
* Vulgarisation de la recherche (articles de presse, réseaux sociaux, etc.)
En particulier, Emvista est coordinatrice d’un projet de recherche collaboratif intitulé POPCORN “Peuplement OPérationnel de bases de COnnaissances et Réseaux Neuronaux”. Ce projet subventionné par l’Agence de l’Innovation et de Défense (AID) implique trois partenaires : Emvista, Airbus Defense and Space et le Laboratoire d’Informatique de Grenoble (équipe GETALP). Le projet POPCORN aborde le problème de l’enrichissement semi-automatisé d’une base de connaissance via l’analyse automatique de textes. Le projet se focalise sur les trois axes de recherches suivants :
* Génération avec des LLM de données synthétiques textuelles à partir de textes de référence
* La reconnaissance des entités d’intérêt, des attributs associés et des relations entre les entités
* La désambiguisation sémantique des entités (en cas d’homonymie par exemple) et le liage d’entités (entity linking)
POPCORN mobilise plusieurs personnes de Emvista dont vous qui aurez pour mission de prendre en charge les travaux impliquant du machine learning/deep learning appliqué au texte en collaboration avec les partenaires. Les résultats issus des recherches menées sur le projet POPCORN seront intégrés dans les solutions commercialisées de Emvista, dont Prevyo.
Profil recherché :
* Très bonne connaissance des techniques et approches de machine learning pour le traitement automatique du langage naturel.
* Maîtrise des modèles de langage récents (LLM notamment) et de façon globale, connaissance des nouvelles technologies NLP, des approches statistiques applicables au NLP ; autonomie sur le développement des modèles d’intelligence artificielle.
* Doctorat ou diplôme d’ingénieur avec spécialisation dans le Traitement Automatique du Langage Naturel.
* Très bonne expression écrite en français (idéalement d’une langue supplémentaire).
* Être pédagogue.
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.