Stage PFE au sein de la Data Custodian (Data Engineering, Data Mining & Delivery).
# Description du projet :
Prédiction des Pannes Systèmes avec l'Apprentissage Automatique
Ce UC vise à mettre en place un système de prédiction anticipée des pannes systèmes, minimisant les temps d'arrêt et optimisant la maintenance préventive. En tirant parti de l'apprentissage automatique, nous visons à analyser des données issues de sources variées pour anticiper les défaillances potentielles et réduire les coûts d'intervention
# Compétences requises :
i) Compétences en traitement des données :
- ETL (Extract, Transform, Load) : Collecte de données de multiples sources (IoT, logs systèmes, bases de données, etc.).
- Big Data : Utilisation d'outils comme Apache Spark, Hadoop, ou Kafka pour gérer des volumes importants de données en temps réel.
- Bases de données : Maîtrise des bases relationnelles (SQL) et non relationnelles (MongoDB, Cassandra).
ii) Infrastructure et architecture IT :
- Déploiement des modèles : Utilisation de conteneurs (Docker, Kubernetes) pour garantir la scalabilité et l'efficacité.
- CI/CD pour le ML : Mise en œuvre de pipelines d'apprentissage automatique (MLOps).
iii) Compétences en optimisation et maintenance :
- Analyse des séries temporelles : Utilisation de techniques comme les modèles ARIMA, LSTM, ou Prophet pour traiter les données temporelles.
iv) Diversité des Modèles : Intégrer des approches avancées en apprentissage profond (Deep Learning) et apprentissage machine (Machine Learning), incluant des techniques non ou semi-supervisées, pourrait enrichir significativement le traitement des données peu étiquetées.
# Résultats attendus et livrables :
i) Prédictions fiables des pannes :
- Identification anticipée des pannes potentielles avec une précision minimale de 85-90%.
- Classement des pannes par ordre de criticité (pannes majeures vs mineures).
ii) Scalabilité :
- Métriques et Risques : L'accent sur la minimisation des faux positifs est essentiel. Ajouter des méthodes de calibration renforcerait la précision dans les cas critiques.
- Une évaluation des performances dans différents environnements de production garantirait une meilleure robustesse.
iii) Visualisation des performances et des risques :
Mise en place d'un tableau de bord interactif (via PowerBI, Tableau ou équivalent) permettant :
- Le suivi en temps réel des KPI (temps d'arrêt, coûts de maintenance, taux de précision des prédictions).
- Une visualisation des tendances et des modèles de pannes.
Etudiant(e) en dernière année de formation Bac+5 en école d'ingénieur avec des compétences en data
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.