Contexte :
Dans le domaine de l’apprentissage automatique, la détection d'anomalies est un problème classique qui consiste à identifier des éléments, des événements ou des observations rares qui soulèvent des suspicions en différant de manière significative de la majorité des autres données. Généralement, les anomalies indiquent un problème tel qu'une fraude bancaire, un défaut structurel, un problème médical ou une attaque dans un système informatique. De nombreux algorithmes d’apprentissage automatique “classiques” ont été développés pour attaquer ce problème, cependant encore peu de travaux ont essayé d’utiliser l’apprentissage profond.
L’apprentissage profond (Deep Learning) est une avancée majeure de l'apprentissage automatique de ces dernières années. Cette approche de l’apprentissage automatique consiste à apprendre à un réseau de neurones de grande taille à réaliser une tâche de prédiction à l’aide d’un ensemble de données d’apprentissage. L’apprentissage profond s’est rapidement imposé comme un standard dans plusieurs domaines en pulvérisant les records des précédentes méthodes de l’état de l’art. Le but de ce stage est d'appliquer cette approche au problème de la détection d’anomalies.
Sujet :
L’objectif est de développer une nouvelle méthode de détection d’anomalies bénéficiant de la puissance de l’apprentissage profond. Cette méthode s'inspirera des réseaux génératifs adversaires (GAN). Cette architecture devenue très populaire fait jouer l’un contre l’autre deux réseaux de neurones dans le but de générer des données artificielles indissociables de données réelles. Notre architecture devra faire intervenir deux réseaux : un encodeur dont le but est de projeter les données dans un espace latent dans lequel anomalies et données normales sont éloignés au maximum les unes des autres, et un discriminateur qui doit discriminer les anomalies des données normales (voire figure). Comme avec les GAN, les réseaux feront leur apprentissage en jouant l’un contre l’autre.
Toutefois cette architecture ne pourra être apprise que si les bases d’apprentissage comportent des exemples d’anomalies, ce qui n’est pas toujours le cas dans des problèmes réels. Nous prévoyons donc de proposer une deuxième version de notre méthode qui permettra de gérer cette situation. Nous devrons ajouter à l'architecture un générateur qui aura pour but de créer des anomalies artificielles nécessaires à l’apprentissage de l’encodeur et du discriminateur (figure partie rouge). Ces trois réseaux devront être appris simultanément.
Les méthodes proposées durant le stage devront être implémentées en Tensorflow et seront testées sur plusieurs problèmes de détection d’anomalies d’images, détection d’attaques de réseaux informatiques et détection de fraudes.
Profils recherchés :
- Etudiant Master 2 Recherche ou en dernière année d’école d’ingénieur de formation en informatique ou mathématiques appliquées.
- Une solide formation en machine learning est indispensable.
- Des bases en programmation python et une bonne maîtrise de l’anglais sont nécessaires.
- Des connaissances en deep learning et programmation tensorflow seraient appréciées.
- Autonomie et curiosité pour la recherche scientifique.
Début du stage : 2020
Durée : 5-6 mois
Encadrants : Pr Hanczar Blaise, Pr Janodet Jean-Christophe
Type d'emploi : Temps plein, Stage
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.