Utilisation LLMs pour la spécification des politiques de partage des données - CDD - Paris-Saclay F/H
Description du poste
Sciences pour l'ingénieur
Intitulé de l'offre
Utilisation LLMs pour la spécification des politiques de partage des données - CDD - Paris-Saclay F/H
Statut du poste
Durée du contrat (en mois)
36 mois
Description de l'offre
« Rejoignez le CEA pour donner du sens à votre activité, mener et soutenir des projets de R&D nationaux et internationaux, cultiver et faire vivre votre esprit de curiosité. »
Le CEA recherche un(e) Ingénieur(e) en usage des LLMs pour la spécification des politiques de partage des données pour la CEA/DRT (Direction de la Recherche Technologique). Ce poste de cadre en CDD est basé sur le site Nano-Innov de Paris-Saclay, Essonne (91). Il s'agit d'un poste à pourvoir à partir dès que possible.
Le développement de systèmes physiques ou numériques est complexe et implique des défis techniques et humains. La première étape consiste à formaliser les idées en rédigeant des spécifications ou un cahier des charges, généralement rédigés en langage naturel par des analystes fonctionnels. Ces documents sont cruciaux pour le projet et facilitent la communication entre les parties prenantes. L'ingénierie des exigences propose des techniques (revues, modélisation, formalisation) pour améliorer la qualité des documents (cohérence, complétude) et corriger les défauts avant l’implémentation du système.
Les réseaux de neurones à grands modèles (LLM) apportent de nouvelles possibilités dans ce domaine. Nous proposons d’utiliser un agent conversationnel (ChatGPT, Lama) pour modéliser les politiques de partage de données (ODRL) à partir de texte naturel. L’outil recommandera des options de réécriture inspirées des normes INCOSE et EARS, analysera les résultats et fournira un audit sur la qualité du modèle obtenu.
Les LLM sont particulièrement prometteurs pour :
* transformer les exigences non structurées en modèles structurés comme EARS ou des user stories.
* classifier les exigences : comportementale, non fonctionnelles, etc.
* signaler les ambiguïtés, incohérences ou violations potentielles sur la base d'heuristiques de validation prédéfinies.
Cependant, les LLM présentent des limites : hallucinations, biais algorithmiques et généralisation limitée. Pour pallier cela, nous suggérons d’hybrider les LLM avec d’autres techniques (NLP, algèbres de processus) afin de réduire ces impacts.
Au sein de l’équipe « Exigences intelligentes » du laboratoire, votre challenge consistera à :
* Déterminer des schémas ou un langage contrôlé pour représenter le modèle ODRL.
* Déterminer l’efficacité de différentes techniques et formalismes, tel que le NLP, pour éviter les hallucinations lors de la réécriture.
* Analyser, gérer ou générer des données d’entrainement pour des LLM.
* Configurer et piloter un ou plusieurs LLM avec les techniques les plus efficaces pour améliorer la cohérence et la complétude de politiques de partage de données.
* Développer l’outillage logiciel nécessaire aux travaux ci-dessus.
Profil du candidat
* Titulaires d'un doctorat ou d'un Master en informatique, en mathématiques ou en ingénierie des systèmes.
Cela vous tente ? Postulez, ce poste est fait pour vous !
Conformément aux engagements pris par le CEA en faveur de l'intégration des personnes en situation de handicap, cet emploi est ouvert à toutes et à tous.
Localisation du poste
Paris-Saclay
Référence
2024-33325
Description de la Direction
Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un organisme public de recherche. Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans le cadre de ses quatre missions : la défense et la sécurité, l'énergie nucléaire, la recherche technologique pour l'industrie et la recherche fondamentale.
Description de l'unité
Le laboratoire LECS (Laboratoire d'Études et de Conception de Systèmes) du département DILS au sein de l'institut LIST de la direction DRT du CEA se concentre principalement sur la cybersécurité et la protection des données dans les systèmes distribués.
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.