Dans un environnement où la continuité de service est primordiale, l’observabilité des systèmes opérationnels représente un enjeu stratégique. Le Pôle Opérations assure la supervision et la fiabilité d'applications critiques en 24/7, et vise à renforcer ses capacités de détection et d’analyse des incidents grâce à l’intégration d’outils de monitoring et de dashboarding.
L’objectif de l’alternance est de contribuer à la fourniture d’une observabilité efficace à travers :
* La participation à la conception d’une architecture de supervision et de tracing robuste
permettant la gestion centralisée des outils d’observabilité et leur évolutivité.
* La définition d’une stratégie de collecte de métriques variées.
* La mise en place de dashboards de supervision, de remontée d'alerte et d’analyse pour les
techniciens d’exploitation en poste 24/7 (Niveau 1) et les ingénieurs d’exploitation (N2).
Tes missions :
* Analyser les bonnes pratiques en matière de gestion des supervisions (standardisation, versioning, modularité).
* Automatiser le déploiement des dashboards via des pipelines CI/CD (GitLab CI, Jenkins, etc.).
* Optimiser la collecte des métriques en évaluant les différentes sources de données (logs applicatifs, bases de données, infrastructures IT, cloud).
* Affiner le ciblage des métriques en collaborant avec les experts métiers pour identifier celles réellement pertinentes et éliminer les données superflues.
* Proposer une uniformisation de la collecte des logs, traces et métriques dans un environnement applicatif.
* Concevoir et développer des dashboards de monitoring (Grafana) pour offrir une visibilité en temps réel sur l’état des systèmes.
* Collaborer avec les équipes opérationnelles (N1/N2) et systèmes pour identifier les métriques clés et améliorer l’expérience utilisateur des dashboards.
* Automatiser la création et la mise à jour des dashboards.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.