Stage de M1/M2 - Exploitation de l’API BioloMICS dans le cadre du projet Omnicrobe
Date de prise de poste : 1 janvier 2025
L’unité Mathématiques et Informatique Appliquées du Génome à l’Environnement (MaIAGE ; https://maiage.inrae.fr/) est située sur le centre INRAE (https://www.inrae.fr/) de Jouy-en-Josas. Cette unité de recherche regroupe des mathématiciens, des informaticiens, des bioinformaticiens et des biologistes qui développent des méthodes pour répondre à des questions de biologie et agro-écologie, allant de l'échelle moléculaire à celle du paysage en passant par l'étude d'individus, de populations ou d'écosystèmes. MaIAGE est structurée en cinq équipes dont l’équipe Bibliome (https://maiage.inrae.fr/fr/bibliome) qui développe des méthodes de traitement automatique des langues (TAL) et d'apprentissage automatique (ML) pour extraire des informations de textes par des ontologies dans le domaine de la biologie ; l’équipe StatInfOmics (https://maiage.inrae.fr/fr/statinfomics) qui développe et met en œuvre des méthodes statistiques et bioinformatiques dédiées à l’analyse de données “omiques” ; et la plateforme bioinformatique Migale (https://migale.inrae.fr) qui fournit des services à la communauté des sciences de la vie. Cette proposition de stage s’inscrit sur un projet commun aux trois équipes.
Objectifs & Travail demandé
L’unité MaIAGE développe l’application Omnicrobe (Dérozier S et al. PlosOne, 2023) qui rassemble des informations sur les habitats, les phénotypes et les usages des micro-organismes, extraites automatiquement de sources textuelles (PubMed, GenBank, DSMZ, Centres de Ressources Biologiques pour les Microorganismes - CIRM). Les données sont accessibles via une interface web (https://omnicrobe.migale.inrae.fr/) et une interface programmatique (API ; https://omnicrobe.migale.inrae.fr/api). Omnicrobe intègre des données issues du CIRM-BIA, du CIRM-CFBP et du CIRM-Levures, qui sont fournies par les CIRM eux-mêmes. Le ou la stagiaire aura pour mission d’automatiser cette étape de récupération des données des CIRM. Il ou elle explorera les fonctionnalités de l’API de l’outil BioloMICS (https://hal.science/hal-03859206/document), qui gère les données associées aux collections des Centres de Ressources Biologiques. Il ou elle créera un script utilisant cette API permettant la récupération des données des CIRM d’intérêt et l’intégrera dans le workflow global de traitement des données Omnicrobe. En fonction de l’avancement du stage, le ou la stagiaire pourra également modifier le workflow d’intégration des données dans la base de données relationnelle ainsi que l’interface web Omnicrobe.
Remarques : les objectifs du stage seront adaptés au niveau du candidat (master 1 ou master 2).
Compétences techniques recherchées
Procédure : Merci d'envoyer un email accompagné d'un CV et d'une lettre de motivation à sandra.derozier@inrae.fr et valentin.loux@inrae.fr.
Offre publiée le 8 novembre 2024, affichage jusqu'au 31 décembre 2024
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.