Description de poste
Contexte : Le programme DATA a pour objectif de doter notre client dans le secteur des médias des outils permettant une meilleure exploitation des données dans la prise de décision et le développement d'une approche data-driven. Ce programme impacte à la fois les outils, l'organisation et les processus. Les projets en cours couvrent : Initiatives métier : Intelligence Artificielle (IA), segmentation & activation, reportings & analyses. Initiatives techniques : Socles de données, gouvernance & qualité. Organisation : Le consultant intégrera l'équipe DATA Delivery au sein du pôle ingénierie de la direction DATA du groupe. Cette équipe est responsable de l'évolution et de la maintenance des socles de données (usage, VOD, advertising, etc.), ainsi que du partage des données avec des partenaires comme Apple+, Paramount+, etc. L'écosystème technique inclut : AWS (Lambda, EMR Serverless, Kinesis Stream, Firehose, S3, DynamoDB), Spark, DBT, Scala, Python, Snowflake, GitLab CI / CD, Terraform, IA.
Profil candidat :
Missions :
1. Concevoir, développer et déployer des pipelines de données scalables et performants.
2. Construire et optimiser un moteur de recommandation exploitant des modèles de Machine Learning et des techniques avancées de traitement des données.
3. Mettre en place des architectures Big Data sur AWS (S3, EMR, Lambda, Snowflake, etc.).
4. Développer en Scala et exploiter Apache Spark pour le traitement massif des données.
5. Automatiser les workflows avec Apache Airflow et DBT pour orchestrer les pipelines.
6. Concevoir et exposer des APIs performantes pour servir les recommandations en temps réel (Scala, Spark, Terraform, GitLab CI / CD, ECS Fargate, Kinesis, DynamoDB, S3, etc.).
7. Optimiser les performances et garantir la scalabilité du système pour gérer un grand volume d’utilisateurs.
8. Collaborer avec les équipes Data Science, Produit et DevOps pour assurer une intégration fluide.
Exemples de projets en cours :
1. AI pour la recommandation de programmes.
2. Feature Store.
3. Modernisation des flux financiers.
4. Content Platform.
5. Mise en place de Kubernetes.
6. Plateforme de traitement des données CRM et usage.
7. Partage de données clients avec des partenaires (Netflix, Apple, M6, TF1, etc.).
8. Mise à disposition d'applications de self-service data.
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.