« Rejoignez le CEA pour donner du sens à votre activité, mener et soutenir des projets de R&D nationaux et internationaux, cultiver et faire vivre votre esprit de curiosité. »
EN SYNTHESE, QU’EST-CE QUE NOUS VOUS PROPOSONS ?
Le CEA recherche un(e) Ingénieur(e) en usage desLLMs pour la spécification des politiques de partage des donnéespour la CEA/DRT (Direction de la Recherche Technologique). Ce poste de cadre enCDDde 36 mois est basé sur le site Nano-Innov de Paris-Saclay, Essonne (91).
Il s'agit d'un poste à pourvoir à partir dès que possible.
POURQUOI NOUS REJOINDRE ?
Le développement de systèmes physiques ou numériques est complexe et implique des défis techniques et humains. La première étape consiste à formaliser les idées en rédigeant des spécifications ou un cahier des charges, généralement rédigés en langage naturel par des analystes fonctionnels. Ces documents sont cruciaux pour le projet et facilitent la communication entre les parties prenantes. L'ingénierie des exigences propose des techniques (revues, modélisation, formalisation) pour améliorer la qualité des documents (cohérence, complétude) et corriger les défauts avant l’implémentation du système.
Les réseaux de neurones à grands modèles (LLM) apportent de nouvelles possibilités dans ce domaine [2]. Nous proposons d’utiliser un agent conversationnel (ChatGPT, Lama) pour modéliser les politiques de partage de données (ODRL[1]) à partir de texte naturel. L’outil recommandera des options de réécriture inspirées des normes INCOSE et EARS, analysera les résultats et fournira un audit sur la qualité du modèle obtenu.
Les LLM sont particulièrement prometteurs pour :
* transformer les exigences non structurées en modèles structurés comme EARS ou des user stories [2]
* classifier les exigences [3] : comportementale, non fonctionnelles, etc. comme défini par exemple dans [4]
* signaler les ambiguïtés, incohérences ou violations potentielles sur la base d'heuristiques de validation prédéfinies [5] [2]
Cependant, les LLM présentent des limites : hallucinations, biais algorithmiques et généralisation limitée [2]. Pour pallier cela, nous suggérons d’hybrider, comme dans [1], les LLM avec d’autres techniques (NLP, algèbres de processus) afin de réduire ces impacts.
QU’ATTENDONS-NOUS DE VOUS ?
Au sein de l’équipe «Exigences intelligentes» du laboratoire, votre challenge consisteraà :
* Déterminer des schémas ou un langage contrôlé pour représenter le modèle ODRL.
* Déterminer l’efficacité de différentes techniques et formalismes, tel que le NLP [6] ou inspiration de la métrique Bleu [7], pour éviter les hallucinations lors de la réécriture.
* Analyser, gérer ou générer des données d’entrainement pour des LLM
* Configurer et piloter un ou plusieurs LLM avec les techniques les plus efficaces pour améliorer la cohérence et la complétude de politiques de partage de données.
* Développer l’outillage logiciel nécessaire aux travaux ci-dessus.
#CEA-List
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.