About the role
Au sein de la division Innovation du groupe Orange, dans une équipe spécialisée en Data Science, vous conduirez une étude visant à enrichir la méthodologie utilisée notamment pour le scoring de bases clients dans divers domaines métiers. En particulier, vous serez amenés à travailler sur des cas d’applications opérationnels pour des services financiers déployés en Afrique de l’Ouest.
Dans les processus actuels de scoring sur des bases client, les approches visent exclusivement à exploiter les données d’usage des services par le client. Dans une telle démarche, on n’exploite pas les informations qui pourraient être apportées par des données externes, telles que des événements particuliers du calendrier (fêtes, vacances, …) ou encore des informations géographiques (présence du client dans une zone urbaine ou rurale, précipitations, taux d’électrification de la zone, etc … ). Pourtant l’exploitation de telles données externes a déjà fait ses preuves dans d’autres méthodologies, notamment l’intégration de dates sur des événements particuliers dans la prédiction de séries temporelles. On visera donc ici à étudier l’utilité d’informations externes pour améliorer certaines tâches de scoring, autrement dit on s’interrogera sur la possibilité de compléter la classification des comportements des clients selon des facteurs extérieurs qui ne sont que partiellement (voire pas du tout) captés par les variables d’usages que l’on peut mesurer dans les données de l’entreprise. On se focalisera en particulier sur l’intégration de données géographiques, telles que des cartes satellites apportant diverses informations (illumination nocturne, densité urbaine, …).
Le premier objectif de votre stage sera de développer une librairie logicielle qui permette d’ingérer des données spatiales (typiquement images satellites) pour faire la jointure avec des données tabulaires et de tester leur pertinence dans des tâches de classification. Ce travail constituera une forme de protypage pour étendre l'écosystème du logiciel d’apprentissage open source Khiops avec une nouvelle forme de données en entrée.
Le second objectif du stage portera sur l’évaluation de la pertinence de ses données. On cherchera dans l’état de l’art si des benchmarks de référence existent et permettent une première évaluation de la librairie développée.
Cette phase d’évaluation pourra être enrichie par l'application à une tâche d’apprentissage choisie en collaboration avec un partenaire opérateur de services financiers : on pourrait par exemple explorer l'apport de données satellitaires dans l'apprentissage de modèles de scoring financier en Côte d'Ivoire.
Le stage comprendra plusieurs phases :
Revue de littérature : explorer les approches existantes, les métriques d’évaluation et datasets de référence
Développement d’une librairie permettant d’intégrer des données géo-spatiales dans un flux d’apprentissage supervisé
Benchmarking : évaluation de l'apport des données géo-spatiales
about you
• Étudiant(e) en Data Science, Informatique ou domaine connexe, niveau Master 2 / Ecole d’ingénieur.
• Connaissances en apprentissage automatique.
• Appétence pour le développement (prototypage python)
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.