Stage en Data Science / Exploiter les LLM pour la rédaction scientifique et médicale
Stagiaire en Data Science:
Exploiter les large language models (LLM) pour la rédaction scientifique et médicale
L’entreprise
Biofortis SAS est une société de services en recherche clinique ou CRO (Contract Research Organization) dédiée à l’innovation dans les secteurs agroalimentaire, nutrition, santé, cosmétique et pharmaceutique. Biofortis accompagne le développement des produits de ses clients en offrant des services originaux et innovants allant du développement scientifique de nouveaux produits, en passant par l’apport de preuves précliniques et cliniques, jusqu’aux analyses du microbiote et leur interprétation scientifique.
Dans le cadre de ses activités de R&D, Biofortis recherche un(e) stagiaire en Data Science au sein de la Business Unit Biométrie et Data Science pour une durée de 6 mois.
Ce projet vise à évaluer et comparer les performances de différentes solutions LLM (par exemple des modèles de type GPT), dans la génération de protocoles et rapports (et résumés) d'études cliniques sur des architectures privées et sécurisées.
Plus spécifiquement, les objectifs sont les suivants :
* Identification des solutions LLM les plus pertinentes.
* Installation et configuration de solutions LLM sur des architectures privées, sécurisées et proposant des ressources de calculs (type serveurs de calculs internes, cloud AWS, …).
* Évaluer la qualité des outputs générés par chaque solution LLM.
* Analyser la capacité de chaque solution LLM à traiter des données cliniques complexes et variées, y compris des données structurées et non structurées.
* Proposer des recommandations pour l'amélioration des performances des solutions LLM (fine-tune) dans ce contexte spécifique.
Ce travail sera réalisé en collaboration avec les équipes de data science et de rédaction scientifique et médicale.
Profil recherché
* Master 2 ou dernière année d’école d’ingénieur en intelligence artificielle, data science, bioinformatique ou dans un domaine connexe.
* Compétences techniques
o Compétence en programmation (Python, API d'IA, NLP).
o Bonne maîtrise des modèles LLM et des concepts associés (fine-tuning, évaluation des performances, prompt engineering).
o Expérience avec au moins un framework IA/ML comme TensorFlow, PyTorch, Hugging Face Transformers.
o Intérêt pour la sécurité et confidentialité des données dans un environnement réglementé (RGPD).
* Connaissance des architectures cloud / serveurs de calculs.
* Expérience avec LangChain pour le développement d’applications LLM.
* Connaissance des flux de travail de la documentation de la recherche clinique.
* Compréhension de la science de la nutrition et de la recherche liée au microbiome.
* Compétences générales:
o Anglais scientifique lu et écrit
o Communication, adaptabilité, rigueur, dynamisme, bon relationnel, esprit d’équipe, de synthèse et d’initiative.
Date de début: dès que possible
Durée: 6 mois
Horaire hebdomadaire de travail: 35h
Indemnité de stage: Rémunération convention de stage + participation aux titres restaurant et frais de transport en commun
Procédure : Merci d’adresser CV + lettre de motivation à: Diego Tomassi, Senior Data Scientist : diego.tomassi@biofortis.fr
Offre publiée le 14 janvier 2025, affichage jusqu'au 30 avril 2025
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.