Contexte du recrutement et définition de poste
Le projet GAIA Data est porté par les trois Infrastructures de Recherche DATA TERRA, PNDB et CLIMERI-France, inscrites sur la feuille de route nationale en tant qu'Infrastructure de Recherche à vocation numérique (e-infrastructure).
Au coeur de la stratégie numérique et données du Ministère de l'Enseignement Supérieure, de la Recherche et de l'Innovation, ce projet structurant vise à développer une plateforme intégrée de données et de services distribués sur les centres de calculs et de données de plusieurs organismes (CNRS, IRD, Ifremer, CNES, BRGM, IGN, Météo-France) pour l'observation et la compréhension du système terre et de l'environnement.
Ce dispositif sera un élément clef pour répondre à des défis scientifiques tels que le changement climatique ou les aléas et impacts sur la société.
Activités :
Sous la responsabilité du responsable scientifique MNHN Gaia data, responsable de la coordination scientifique et technique PNDB, et au sein de l'UAR DOHNE, le titulaire du poste aura pour mission :
- Encadrer les développements d'outils Galaxy principalement à partir de scripts R ou Python existants ou à créer. Les outils à intégrer concerneront notamment 1/ le traitement de données hétérogènes biodiversité - système terre et/ou climat via modélisation 2/ la gestion et le partage de données et métadonnées 3/ le partage et l'annotation de médias (sons, images, vidéos) et 4/ le partage de composants VRE entre solutions différentes.
o Les développements seront réalisés via Planemo, le kit de développement d'outils Galaxy, sur environnement linux en ligne de commande et les aspects gestion de codes, intégration continues et publication des outils seront gérés via le dépôt Github dédié https://github.com/galaxyecology/tools-ecology# et le recours à Github actions.
o Les développements seront effectués principalement par des prestataires, et l'ingénieur(e) recruté(e) aura pour mission de suivre ces développements et d'effectuer les examens et tests de codes afin de s'assurer qu'ils respectent les bonnes pratiques de développements Galaxy. Le pilotage de ces prestations sera réalisé en mode collaboratif avec les porteurs de cas d'usages « projet » et les trois infrastructures de recherche
- Développer le matériel de formation permettant de mettre en avant l'utilisation des outils développés et cela en utilisant les ressources et l'infrastructure du Galaxy Training Network basé sur un dépôt Github dédié.
- Rendre compte régulièrement des avancées des travaux au sein de l'équipe opérationnelle PNDB et en réunions d'avancements des travaux Gaia Data
Contexte de travail :
GAIA DATA (https://www.data-terra.org/evenement/lancement-gaia-data/) est un projet du Programme d'Investissement d'Avenir structurant au niveau national. Ce projet est coordonné par le CNRS et compte 21 partenaires dont des organismes comme l'IFREMER, le BRGM, le CNES, l'IGN, METEO-France
Il vise à développer une plateforme de services distribués de type cloud permettant d'exploiter au mieux et à l'état de l'art les données (satellite, modèle, in-situ) du système Terre. Cela inclut notamment une interopérabilité pour l'accès aux données et des traitements. Etant donné la volumétrie des données, priorité est donnée aux traitements déportés (i.e. sur les centres de calculs plutôt que sur les machines des utilisateurs).
Les données gérées par le projet GAIA DATA sont réparties dans 8 sites en France : Brest, Grenoble, Lille, Montpellier, Orléans, Paris, Strasbourg et Toulouse. Leur volume représente plusieurs dizaines de Po. GAIA DATA vise à servir une communauté de 15000 utilisateurs issus de la communauté recherche et des acteurs publics et privés.
Dans le cadre du développement des services Gaia Data, le Muséum national d'histoire naturelle, pour le PNDB, est en charge de la mise en place de solutions d'environnements virtuels de recherche orientés workflows scientifiques à travers l'usage de la plateforme open source Galaxy. Le PNDB coordonne depuis 2018 l'initiative Galaxy-E (pour Ecologie) portant dans la plateforme Galaxy des outils de traitement de données environnementales et dont une instance européenne est accessible à cet URL https://ecology.usegalaxy.eu/ et repose sur un service existant du marketplace EOSC : Galaxy Europe. Il est proposé de poursuivre ce travail initié par le PNDB sur la mise à disposition d'outils et de matériel de formation en e-learning dans le cadre du projet Gaia data et dans un objectif de prise en compte de données multisources au sein d'une instance Galaxy dédiée au système Terre et Environnement.
Partenaires internes : PNDB, Gaia Data, UAR DOHNE.
Partenaires externes : Prestataires de services, Etablissements de recherche, Universités
Profil recherché
Qualifications requises :
- Connaissance de l'environnement linux en ligne de commande
- Maîtrise du langage R
- Expérience souhaitée de l'environnement Galaxy et des bonnes pratiques d'intégration d'outils notamment l'utilisation de Planemo
- Connaissance de plateformes de développement logiciel de type GitHub
- Intérêt pour la création de matériel de formation sera un gros plus
- Intérêt pour le domaine d'application, la macro-écologie et une expérience en analyse de données protocolées serait un gros plus
- Intérêt pour participer aux actions de formation sera également un plus
Compétences :
- Posséder le sens de l'écoute, capacités d'analyse, de synthèse et de vulgarisation
- Sens de l'organisation, rigueur, initiative, efficacité et esprit de synthèse
- Curiosité
- Posséder de bonnes capacités organisationnelles, autonomie et force de proposition
- Capacité à penser en dehors des chemins établis
- Intérêt pour l'open science
- Capacité à travailler aussi bien en équipe qu'en autonomie
- Culture du service à l'utilisateur
Information(s) complémentaire(s)
Venez rejoindre un établissement chargé d'histoire, engagé dans la société, en pleine évolution, à la renommée nationale et internationale. Riche d'une grande variété de métiers et d'activités, le Muséum vous propose d'intégrer des équipes à taille humaine dans un cadre de travail agréable et un environnement stimulant.
Le contrat
Localisation : Jardin des plantes
Contrat : Contrat de projet de 2 ans dès que possible
Temps de travail : 35h35 par semaine et 44 jours de congés annuels
Les avantages
Remboursement de 75% des frais de transport en commun et forfait mobilités durables (vélo ou covoiturage)
Télétravail possible jusqu'à deux jours par semaine après 4 mois d'ancienneté selon le poste
Restaurant d'entreprise
Prise en charge partielle de votre mutuelle selon conditions
Un comité social et une association sportive et culturelle
Accès illimité aux sites de l'établissement avec invités
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.