Une des missions du CNES consiste à favoriser la valorisation et l'utilisation des données produites par les missions satellites. Dans ce cadre, le CNES développe GEODES, le nouveau portail des données spatiales d'Observation de la Terre au service de la Science et de l’Innovation. Outre permettre la recherche et diffusion de données via téléchargement, le CNES souhaite également fournir de nouveaux moyens pour simplifier l'accès à ses données et les analyses à l'échelle de collections de plusieurs Pétaoctets de volume. Nous disposons pour cela également d'un service appelé Datalabs, basé sur les notebooks Jupyter, et donnant accès à une forte puissance de calcul, ainsi que d'un projet nommé PLUTO, qui vise à proposer des librairies logicielles permettant le traitement et l'analyse des données.
Plusieurs plateformes sont également proposées par nos partenaires ou des entreprises privées, par exemple Google Earth Engine, Microsoft Planetary Computer, Destination Earth Platform, etc. Ces plateformes sont souvent basées sur un socle technologique commun et tentent avec plus ou moins de succès de fournir un service intégré de manipulation de données basé sur des interfaces de type Notebook. La différence entre ces plateformes se fait généralement au niveau des collections de données disponibles mais aussi sur le niveau de service et de simplicité d'accès à ces collections, de leur manipulation, et de l'interactivité proposée.
L'objectif de ce stage est donc d'identifier, de proposer puis de prototyper un socle de services ou librairies intégrés permettant d'améliorer l'expérience utilisateur pour l'accès et le traitement aux données hébergées sur GEODES. Selon les compétences et appétences du stagiaire, les activités suivantes pourront être menées :
- État de l’art des plateformes de type Datacube interactives existantes.- Établissement de critères de comparaison : documentation, API, données disponibles, fonctionnalités, visualisation, simplicité, etc.
- On pourra également se baser sur l'implémentation d'un traitement de base comme une version de l'algorithme Let It Snow (détection de neige) simplifiée comme base de comparaison.
- Quelles sont les fonctionnalités communes et intéressantes, les librairies généralement utilisées ?
- Qu’est-ce qui manque aux services proposés par le CNES, quelles sont les fonctionnalités que nous pourrions facilement proposer ?
- Identification d’une pile logicielle de base à fournir aux utilisateurs (ex pystack, pygeodes, Xarray, outils de visu, etc.)
- Prototypage d'une première version cette pile en perspective de sa mise en place dans des services proposés par le CNES
- Identification de fonctionnalités ou autres améliorations qui pourraient être proposés sur GEODES : ingestion d'autres données, optimisation du format des données, outils de recherche et visualisation de données intégrés aux Notebooks, etc.- Prototypage d'éléments choisis de ces fonctionnalités
- Mise en place de Tutoriel de manipulation de données sur Datalabs GEODES ou à l’extérieur.
- Contributions à l'écosystème Open source en fonction des opportunités.
Le stage pourrait débuter en février/mars 2025
Diplôme d'ingénieur ou Master en informatique ou science des données.
- Intérêt pour les données géospatiales et leur utilisations
- Bonne connaissance du langage Python
- Connaissance des outils de manipulation de données (Pandas, Xarray)
- Connaissance des technologies Jupyter Notebook
- Connaissance des techniques d'ingénierie logicielle (gestion de configuration git, intégration continue, etc.)
- Pratique du développement open source.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.