Stage: Ingénieur Machine Learning F/H, Levallois-Perret
Faites ressortir le meilleur de vous-même
Les innovations de SAP permettent à plus de quatre cent mille clients dans le monde de travailler ensemble plus efficacement et d'utiliser plus efficacement les informations commerciales. Connu à l'origine pour son leadership en matière de logiciels de planification des ressources d'entreprise (ERP), SAP a évolué pour devenir un leader du marché des logiciels d'application de gestion de bout en bout et des services connexes pour les bases de données, l'analytique, les technologies intelligentes et la gestion de l'expérience. En tant que société en nuage comptant deux-cents millions d'utilisateurs et plus de cent mille employés dans le monde, nous sommes motivés et tournés vers l'avenir, avec une éthique d'équipe hautement collaborative et un engagement envers le développement personnel.
Votre mission:
L'objectif de ce stage est d'étudier et de comparer différentes méthodes de gestion des variables catégorielles à haute cardinalité et des variables textuelles dans le cadre de la modélisation prédictive utilisant des algorithmes de Gradient Boosting. Pour ce faire, le stagiaire devra suivre les étapes suivantes :
1. Réaliser un état de l'art : Étudier les méthodes actuellement implémentées dans les différentes bibliothèques open-source de Gradient Boosting (XGBoost, LightGBM, CatBoost, Scikit-Learn, etc.). Analyser les méthodes d'encodage publiées et implémentées dans d'autres bibliothèques, comme skrub. Présenter un état de l'art précis à l'équipe, en mettant en avant les avantages et inconvénients de chaque méthode.
2. Mener des expérimentations : Lancement des expérimentations pour comparer les performances des différentes méthodes sur un grand nombre de jeux de données réels. Évaluation de l'impact des méthodes sur la précision des modèles, le temps de calcul et la consommation de mémoire.
3. Présentation des résultats : Rédaction d'un rapport détaillant les méthodes testées, les résultats obtenus et les recommandations. Présentation des conclusions à l'équipe.
Votre profil:
* Étudiant(e) en master ou école d’ingénieur, vous avez des compétences en :
Modélisation statistique et Machine Learning (modèles de classification et régression). Programmation en Python, ainsi que l’environnement Machine Learning. Vous savez travailler en équipe dans un environnement collaboratif. Vous êtes capable de mettre en place une méthode scientifique rigoureuse, afin d'apporter des conclusions fiables sur une étude. Vous êtes capable de faire des synthèses en anglais de votre travail et ouvert d'esprit pour explorer de nouvelles méthodes.
Votre équipe:
Vous intégrerez l'équipe « Predictive Engines », composée de développeurs et data scientistes, qui développe un moteur de modélisation prédictive (classification, régression, et séries temporelles) basé sur le Machine Learning et l'intègre dans des applications SAP, notamment SAP Analytics Cloud.
Durée : 4 à 6 mois
Date de début :Mai 2025
Conformément à la législation française, pour toute durée supérieure à 2 mois, ce stage fait l'objet d'une gratification, en alignement avec la grille définie par SAP.
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.