Job details
Job Type
Full-time
Temporary
Contract
Full Job Description
Date Limite Candidature : jeudi 7 octobre 2021
Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !
Informations générales
Référence : UMR9015-ONOSEM-001
Lieu de travail : ST AUBIN
Date de publication : jeudi 16 septembre 2021
Nom du responsable scientifique : PI: Onofrio Semeraro (CNRS, CRCN).
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 novembre 2021
Quotité de travail : Temps complet
Rémunération : 2 135,00 € brut mensuel
Description du sujet de thèse
Les besoins environnementaux nourrissent l'effort de recherche dans de nombreux domaines de l'ingénierie comme par exemple sur la réduction des émissions de CO2, largement considérées comme une des causes principales du réchauffement climatique. Cette urgence s'étend à de nombreuses applications,comme l'aéronautique où l'optimisation des écoulements aérodynamiques a un impact significatif sur la réduction des émissions polluantes, l'atténuation du bruit rayonné ou le contrôle des systèmes dans des conditions complexes comme les écoulements décollés. En principe, les stratégies de contrôle permettent une optimisation en temps réel, basée sur des mesures par capteurs et des modèles physiques. En pratique, dans des situations réalistes, cette approche est limitée à quelques configurations numériques et expérimentales seulement. L'objectif du projet ANR-REASON est de vérifier dans quelle mesure l'apprentissage par renforcement (AR) est une alternative viable au contrôle d'écoulements en conditions réelles. Les algorithmes d'AR reposent sur des données passées pour déterminer la commande future d'un système dynamique en déterminant une politique de contrôle optimale à partir de l'exploration de l'espace état-action. Cette étape remplace le modèle physique et ces algorithmes sont uniquement basés sur les données de mesure du système et la façon dont il réagit à des actions spécifiques. Cela permet d'éviter certaines limites des approches de contrôle basées sur des modèles, comme le recours à des modèles réduits qui peuvent considérablement perdre de pertinence lorsque le contrôle est appliqué, résultant en une faible performance et un manque de robustesse. Le but principal de ce projet est de proposer des avancées en contrôle d'écoulements en faisant le lien avec l'apprentissage par renforcement pour résoudre les difficultés qui ont limité le succès des approches standard pour les écoulements non-linéaires complexes.
Le doctorant se concentrera spécifiquement sur le contrôle des écoulements a l'aide de AR. Dans un premier temps, le candidat analysera d'un point de vue théorique le AR, notamment les algorithmes « actor-critic », dans le cadre théorique de la programmation dynamique et du contrôle optimal. Les efforts méthodologiques porteront en particulier sur deux aspects : i) l'amélioration de l'exploration et de l'exploitation pendant l'apprentissage des politiques optimales de AR ; ii) l'introduction de contraintes physiques et/ou d'approximations alternatives pour la fonction de valeur et les politiques optimales. Ces domaines de travail visent à réduire la quantité de données requises pour l'apprentissage et à suggérer des méthodologies possibles pour l'introduction de marges de garantie.
Les applications numériques seront de complexité progressive. Nous considérerons d'abord des modèles simplifiés (par exemple l'équation de Kuramoto-Sivashinsky ou l'équation de Ginzburg-Landau), pour le développement et la comparaison directe des outils de AR avec le contrôle optimal. Comme exemple en mécanique des fluides, nous considérerons l'écoulement de couche limite laminaire sur une plaque plane bidimensionnelle. Le démonstrateur final portera sur la simulation numérique et le contrôle d'écoulements cisaillés à nombre de Reynolds modéré et le contrôle de la dynamique bi-stable d'un écoulement 3-D derrière un obstacle, en collaboration avec le partenaires de l'IMSIA-ENSTA.
Contexte de travail
Le poste de docteur sera occupé au LISN dans le cadre du projet ANR-REASON. Le projet est coordonné par le LISN. interagira principalement avec les membres de l'équipe Decipher au LISN et travaillera en collaboration avec les partenaires du projet à TAU-team et LAMSADE Paris-Dauphine. La partie expérimentale sera dirigée par l'IMSIA-ENSTA (Palaiseau). Des missions pour des conférences pourront être financées pendant le doctorat. Le boursier doctoral recevra un ordinateur portable et des accessoires.
Informations complémentaires
Main advisor: Alexandre ALLAUZEN (Paris-Dauphine-ESPCI)
Co-advisors: Onofrio SEMERARO (LISN-CNRS); Lionel MATHELIN (LISN-CNRS)
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.