Stage en vision par ordinateur et deep learning H/F
Description du poste
Mathématiques, information scientifique, logiciel
Sujet de stage
Apprentissage profond pour l'interprétation de représentations 3D implicites
Durée du contrat (en mois)
Description de l'offre
Contexte du stage
Le développement de robots autonomes, qu’il s’agisse de robots terrestres ou volants, nécessite la mise en place d’intelligences artificielles (IA) capables d’interpréter l’environnement observé. Pour pouvoir raisonner au-delà du seul environnement observable par ses capteurs à l’instant courant, le robot doit construire une carte 3D de l’environnement qu’il a observé et disposer de moyens pour interpréter cette carte 3D.
Actuellement, les nuages de points 3D correspondent à la représentation 3D la plus utilisée pour cette tâche, et de nombreuses solutions de Deep Learning ont été proposées pour leur interprétation. Plus récemment, des représentations 3D exploitant des réseaux de neurones ont été introduites. Ces représentations, généralement désignées sous le terme de Neural Fields, ont démontré de bonnes performances en termes de reconstruction, mais très peu de travaux ont investigué la manière d’interpréter directement ces représentations à l’aide d’un réseau de neurones.
Objectifs du stage
Ce stage a pour objectif de proposer une solution d’interprétation par réseaux de neurones de scènes 3D représentées sous forme de Neural Fields. Le stage aura pour objectifs de :
- Étudier l’usage des architectures classiques (CNN, Transformers…) dans le cadre de l’interprétation de Neural Fields
- Étudier le co-design d’une représentation Neural Fields et de sa méthode d’interprétation afin d’obtenir le meilleur compromis qualité de reconstruction 3D/qualité d’interprétation possible.
- Évaluer les performances de la méthode proposée.
Compétences souhaitées
Ce stage permettra à l’étudiant de découvrir d’une part le domaine extrêmement dynamique des représentations 3D neurales, et d’autre part celui de l’interprétation de scène 3D.
Profil du candidat
Le candidat devra disposer d’une bonne maîtrise de Python et d’une forte connaissance en réseaux de neurones. Une expérience sur Pytorch sera appréciée.
Conformément aux engagements pris par le CEA en faveur de l’intégration de personnes en situation de handicap, cet emploi est ouvert à tous et toutes.
Localisation du poste
[Localisation à préciser]
Informations générales
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat. Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Référence
2024-33727
Description de l'unité
Laboratoire Vision pour la Modélisation et la Localisation (LVML) du CEA Tech LIST mène des recherches en vision par ordinateur et intelligence artificielle, en adressant les problématiques suivantes :
- Géolocalisation et cartographie d'environnement par vision et fusion de capteurs (robotique mobile, drones…)
- Systèmes de vision pour la robotique : préhension, manipulation, assemblage d'objets…
- Contrôle de conformité, détection de défauts géométriques, colorimétriques, etc…
- Analyses hyperspectrales : détection de matériaux, tri, ….
- Correction, amélioration d'images et vidéos (superrésolution, upframing, …)
- Compression de réseaux de neurones.
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.