Contexte et atouts du poste
La thèse se place à l'intersection des jeux répétés et de l'apprentissage statistique, et ce dans le but de développer des algorithmes robustes et équitables.
Beaucoup d'algorithmes d'apprentissage fonctionnent séquentiellement (robotique, agent conversationnel, applications avec interactions humaines etc). La théorie des jeux fournit un cadre d'analyse des interactions, duquel peuvent être tirés des algorithmes simples et robustes à appliquer, notamment dans un cadre multi-agents. Il est alors possible de fournir des algorithmes avec des garanties théoriques qui permettent de s'assurer du bon fonctionnement des algorithmes implémentés en pratique.
La théorie des jeux répétés date de la moitié du 20e siècle, elle est particulièrement adéquate pour l'étude de l'apprentissage séquentiel. Ainsi, les jeux répétés asynchrone en sont une extension directe; de même pour la théorie de l'approchabilité, et les algorithmes de matching. Les outils qu'elle a développés seront mis au contact d'autres parties des mathématiques, pour répondre à de nouvelles questions. En particulier, nous nous intéresserons à développer des algorithmes équitables et/ou robustes aux manipulations stratégiques pour différentes applications, incluant les réseaux de télécommunication cognitifs, les algorithmes d'appariement et les algorithmes de prédiction.
Mission confiée
Nous considèrerons trois problèmes largement indépendants.
Axe 1: on cherchera ainsi à développer la théorie des jeux en temps continus asynchronisés, de manière à obtenir des algorithmes simples et robustes, directement applicables au problème de bandits à plusieurs joueurs. Motivé par les réseaux de télécommunications, le problème de bandits à plusieurs joueurs s'est beaucoup développé récemment. Cependant, les différentes solutions proposées prennent difficilement en compte l'asynchronicité des dispositifs utilisés en pratique. A travers une nouvelle formulation mathématique d'asynchronicité, nous souhaitons développer des algorithmes simples et robustes pour ce problème.
Axe 2: la théorie des jeux répétés est également un cadre d’analyse pertinent pour étendre la théorie de l’apprentissage équitable. D’une part, nous nous intéresserons à la théorie de l’approchabilité de Blackwell afin de développer des algorithmes séquentiels de prédiction avec des garanties d'équitabilité. Les travaux récents de Chzhen, Giraud et Stoltz ont déjà permis d'avancer dans cette direction. Le but de cet axe serait d'étendre les résultats existants à des notions plus fortes d'équité, ce qui nécessite de revisiter la méthode d'approchabilité de Blackwell.
Axe 3: d’autre part, nous étudierons des algorithmes d'apprentissage séquentiels pour des problèmes d’appariement, et en particulier dans le contexte d'appariements équitables. L'apprentissage séquentiel d'appariement s'est fortement développé ces dernières années. Cependant, ces travaux récents ne se sont pas intéressés à la notion d'équité dans les appariements, qui est une notion pourtant importante et considérée dans la littérature économique (sans notion d'apprentissage). Le but de cet axe serait donc de lier ces deux pans de la littérature: l'apprentissage séquentiel sur des problèmes d'appariement et les appariements équitables.
Compétences
1. Théorie des jeux
2. Apprentissage séquentiel
3. Master en mathématiques/mathématiques appliquées
Avantages
4. Restauration subventionnée
5. Transports publics remboursés partiellement
6. Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle
7. Possibilité de télétravail et aménagement du temps de travail
8. Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
9. Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
10. Accès à la formation professionnelle
Rémunération
2100€ brut / mois
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.