Description :
Dans un environnement où la continuité de service est primordiale, l'observabilité des systèmes opérationnels représente un enjeu stratégique. Le Pôle Opérations assure la supervision et la fiabilité d'applications critiques en 24/7, et vise à renforcer ses capacités de détection et d'analyse des incidents grâce à l'intégration d'outils de monitoring et de dashboarding.
L'objectif de l'alternance est de contribuer à la fourniture d'une observabilité efficace à travers :
* La participation à la conception d'une architecture de supervision et de tracing robuste
permettant la gestion centralisée des outils d'observabilité et leur évolutivité.
* La définition d'une stratégie de collecte de métriques variées.
* La mise en place de dashboards de supervision, de remontée d'alerte et d'analyse pour les
techniciens d'exploitation en poste 24/7 (Niveau 1) et les ingénieurs d'exploitation (N2).
TES MISSIONS :
* Analyser les bonnes pratiques en matière de gestion des supervisions (standardisation, versioning, modularité).
* Automatiser le déploiement des dashboards via des pipelines CI/CD (GitLab CI, Jenkins, etc.).
* Optimiser la collecte des métriques en évaluant les différentes sources de données (logs applicatifs, bases de données, infrastructures IT, cloud).
* Affiner le ciblage des métriques en collaborant avec les experts métiers pour identifier celles réellement pertinentes et éliminer les données superflues.
* Proposer une uniformisation de la collecte des logs, traces et métriques dans un environnement applicatif.
* Concevoir et développer des dashboards de monitoring (Grafana) pour offrir une visibilité en temps réel sur l'état des systèmes.
* Collaborer avec les équipes opérationnelles (N1/N2) et systèmes pour identifier les métriques clés et améliorer l'expérience utilisateur des dashboards.
* Automatiser la création et la mise à jour des dashboards.
Profil recherché :
Tu es étudiant(e) en école d'ingénieur ou en Master informatique/data ?
TES ATOUTS :
* Bonne connaissance des concepts de monitoring et des outils associés.
* À l'aise avec les environnements Linux et Cloud AWS.
* Sensibilité à l'automatisation et aux pratiques d'Infrastructure as Code.
* Excellentes compétences en communication pour interagir avec les ingénieurs d'exploitation et les techniciens de supervision en H24.
* Curiosité, autonomie et capacité à travailler en environnement opérationnel exigeant.
STACK & OUTILS :
* Dashboarding : Grafana, Grafana Cloud
* Monitoring : Prometheus, ELK, OpenTelemetry
* Scripting & Automatisation : Python, Bash, Terraform, Ansible, Gitlab
* Cloud & Infrastructures : AWS, Linux (serveurs on-premise), Kubernetes, Docker, K8S
* Alerting : NAGIOS, CentreON
CE QUI T'ATTEND :
Des défis stimulants au sein de nos équipes pour optimiser nos systèmes et les rendre toujours plus performants !
Si tu as l'esprit d'équipe et l'envie de relever de nouveaux challenges, rejoins nous dès maintenant et participe à l'aventure CLS ! ¿¿¿¿
LE PROCESS DE RECRUTEMENT :
* Marine te contactera pour un premier échange.
* Entretien avec ton futur tuteur ou ta future tutrice.
* Entretien RH avec Marine pour finaliser.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.