Date?: 17/10/2024
Poste à pourvoir Machine Learning Engineer / Ingénieur en apprentissage automatique (H/F)
Emploi-repère Chef de projet
Catégorie d’emploi Catégorie 1
Type de contrat Contrat à durée indéterminée / Temps complet
Localisation Saint-Denis (93), au pied de la station RER La Plaine Stade de France
Motif de recrutement Remplacement de personnel permanent
Rémunération Selon expérience et niveau de diplôme, par référence aux grilles indiciaires des agences sanitaires en application du décret n°2003-224 du 07 mars 2003 ou selon statut particulier si fonctionnaire (détachement)
DESCRIPTION DU POSTE A POURVOIR
Missions générales du poste à pourvoir
Au sein de la mission data, vous serez en charge des projets de traitement automatique du langage (TAL / NLP) au cœur de l’axe 3 de la stratégie données de la HAS. Vos principales missions consisteront à prototyper et mettre en production des outils et algorithmes d’apprentissage pour valoriser les données textuelles de la HAS.
Cette exploitation du riche patrimoine de données textuelles répond à une forte demande des services, et à des enjeux stratégiques soutenus par la direction. Ainsi, depuis 3 ans, plusieurs projets d’envergure ont déjà été menés, par exemple :
* Constitution d’un data set des métadonnées des publications de la HAS et des textes associés
* Classification automatique des évènements indésirables graves associés à des soins
* Classification automatique des commentaires des patients hospitalisés (e-Satis, 2 millions de commentaires par an) dans
* Prospective sur l’utilisation de grands modèles de langage (LLM) pour la classification des commentaires patients
* Evaluation d’un outil d’apprentissage actif pour le screening de la littérature scientifique
Au fil des projets vous serez amené(e) à :
* Préparer et analyser des données textuelles riches : commentaires des patients après hospitalisation, bibliographies scientifiques, connaissances produites par la HAS ;
* Utiliser des grands modèles de langage (LLM) pour extraire des informations structurées pour les besoins d’analyse bibliographique des différents services de la HAS.
* Concevoir et prototyper des services facilitant le traitement de textes : moteur de recherche, annotation, extraction d’entité, indexation, classification ;
* Piloter des projets d’industrialisation et de déploiement de ces services, en mobilisant des ressources internes et externes ;
* Participer à mettre en place les briques technologiques sous-jacentes (base de données, traitement automatisé, outil d’analyse, exposition par API), en cherchant le bon équilibre entre usage de solutions existantes (open source ou achat) et développement en propre ;
* Effectuer une veille technique et scientifique sur le champ du TAL ;
* Encadrer des stagiaires ;
* Participer à la communauté du traitement de textes biomédicaux et échanger avec les partenaires institutionnels et académiques privilégiés : INRIA, CNRS, LIMSI, ANS, HDH, AP-HP, DINUM, Etalab.
Véritable force de proposition et de mise en œuvre d’outils de traitement du langage, vous aurez à cœur de déployer ces technologies pour mieux exploiter et valoriser les données textuelles à la HAS.
Pour ces différents projets, vous travaillerez étroitement avec la cheffe de projet IA pour la revue de littérature, en charge de la coordination avec les chefs de projets des services de la HAS et de l’identification de leurs besoins sur cette thématique. Elle vous appuiera dans l’identification et l’évaluation de solutions sur les sujets d’analyse bibliographique. Vous travaillerez également avec les trois ingénieurs de l'équipe, responsables de la plateforme, des outillages data, et garants de processus de traitement des données modernes et de qualité. Ils vous appuieront pour disposer des ressources informatiques nécessaires, sur les problématiques d’ingénierie de données, l’automatisation des traitements et par la relecture entre pairs des programmes. L’ensemble des projets sont gérés via GitLab, aussi bien le code, que les tâches (issues), les pipelines (GitLab-CI), et la documentation web (GitLab Pages).
Vous travaillerez régulièrement avec le responsable de la mission data, qui vous aidera à identifier et prioriser les sujets. Vous interagirez aussi avec les autres membres de la mission data à travers des temps d’apprentissage en équipe dédiés. L’équipe est composée de profils variés : médecin de santé publique responsable des études sur la prise en charge des patients, statisticienne spécialisée sur les données SNDS, docteur travaillant sur l’apprentissage statistique à partir d’entrepôt de données de santé, responsable des analyses et outils décisionnels.
Direction et service d’affectation Direction Générale (DG)
Mission data
Rattachée au directeur général, la mission data est une équipe récente dont le rôle est de mettre en œuvre la stratégie données de la HAS, par la réalisation de projets techniques concrets au service des métiers et missions de l’institution autour de 4 axes majeurs.
Cette équipe est à la fois un laboratoire d’innovation, un centre d’expertise, et un catalyseur de transformations dans l’usage des données par la HAS. Elle promeut les dynamiques de connaissance ouverte (open source, open data, open knowledge), conformément aux valeurs de transparence, d’expertise et d’indépendance de l’institution.
PROFIL RECHERCHÉ?:
Formation
Expérience
Compétences Titulaire d’un Master, diplôme d’ingénieur ou diplôme équivalent ; spécialité en statistiques, informatique, big data, intelligence artificielle ou traitement du langage.
Doctorat apprécié
Vous justifiez d’une expérience avérée dans le domaine, avec la réalisation de projets techniques concrets et en équipe. Une expérience professionnelle de plusieurs années, avec la mise en production et la maintenance de modèles de TAL, sera fortement valorisée. Des expériences dans les secteurs sanitaires et sociaux seront appréciées.
De nature autonome, vous savez faire preuve d’initiative et avez un réel sens de l’organisation.
Capacité à formaliser des problématiques métiers, et à concevoir des analyses de données ou des outils appropriés pour y répondre.
Excellente maîtrise de Python, et des librairies de traitement du langage (ex. Spacy, Hugging Face) et de machine learning (ex Scikit-Learn, Pytorch, TensorFlow). Connaissance d’autres langages et frameworks de programmation appréciée (ex. R, JavaScript, C++).
Maîtrise des fondamentaux du traitement automatique du langage (TAL / NLP) : recherche et extraction d’information, reconnaissances d’entités, représentations de textes (ex. TF-IDF, embeddings) ; vous effectuez une veille technique et scientifique sur le sujet.
Expérience sur l'usage des grands modèles de langages (LLM), avec une compréhension de leur potentiel, de leurs particularités d’emploi et de leurs limites.
Maîtrise des systèmes de gestion de base de données, en particulier ceux adaptés au traitement du langage (ElasticSearch).
Maîtrise des notebooks Jupyter, d’un environnement de développement (IDE), de linux, git, et d’une forge logicielle (ex. GitLab, GitHub).
Maîtrise des statistiques et de la visualisation de données.
Vous êtes tourné vers l’action, aimez travailler en équipe et faire progresser le collectif en partageant vos compétences.
LA HAUTE AUTORITÉ DE SANTÉ
Autorité publique indépendante à caractère scientifique, la Haute Autorité de santé (HAS) vise à développer la qualité dans les champs sanitaire, social et médico-social, au bénéfice des personnes.
Elle travaille au côté des pouvoirs publics dont elle éclaire la décision, avec les professionnels de santé pour optimiser leurs pratiques et organisations, et au bénéfice des usagers dont elle renforce la capacité à faire des choix.
Elle exerce trois missions principales :
* évaluer les médicaments, dispositifs et actes en vue de leur remboursement ;
* recommander les bonnes pratiques professionnelles, élaborer des recommandations vaccinales et de santé publique ;
* mesurer et améliorer la qualité dans les hôpitaux, cliniques, en médecine de ville et dans les structures sociales et médico-sociales.
La HAS exerce son activité dans le respect de trois valeurs : la rigueur scientifique, l'indépendance et la transparence.
Elle est organisée autour :
* - d’un Collège de huit membres dont un président ;
* - de commissions spécialisées présidées par des membres du Collège :
* - de services réparties en cinq directions.
Ref : C157O84095
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.