Dans ce contexte, nous recherchons pour renforcer nos équipes un :
Ingénieur SRE - DevOps (F/H)
Vous jouerez un rôle central dans la gestion, la disponibilité et la résilience d’un ou plusieurs services clients. Vous serez responsable d’automatiser, de surveiller et d’améliorer continuellement la fiabilité des systèmes critiques 24/7 de CLS hébergés dans le cloud et/ou on premise.
Votre mission inclut la gestion proactive des incidents, la réduction du temps moyen de réparation et l’amélioration des indicateurs clés de fiabilité (SLO, SLA, SLIs) pour garantir des opérations fluides et une disponibilité optimale des services proposés à nos utilisateurs.
Ce rôle, tout en étant hautement technique, se trouve au cœur de nombreux métiers et requiert une forte capacité de coordination interdisciplinaire.
Dans ce cadres, vos missions principales seront :
Maintien en Conditions Opérationnelles
* Garantir la disponibilité et la performance des services en production dans un contexte 24/7.
* Gérer les incidents majeurs et piloter leur résolution rapide pour limiter l’impact sur les opérations.
* Assurer un rôle de support opérationnel de niveau 2, en travaillant en étroite collaboration avec les opérateurs H24, qui assurent la supervision et les premières analyses d’alertes.
* Collaborer avec les équipes IT et les développeurs pour identifier les causes profondes des incidents et mettre en place des actions correctives et préventives.
Observabilité et fiabilisation
* Mettre en place des outils de monitoring et d’alerting performants et pertinents (Grafana, CentreOn, NAGIOS)
* Définir et suivre les indicateurs de fiabilité (SLI/SLO/SLA) afin d’améliorer en continu la qualité de service.
* Participer à la conception et à la définition des architectures des applications pour renforcer la résilience et minimiser les incidents.
* Automatiser les processus de déploiement, de remédiation et d’exploitation pour réduire la charge opérationnelle et améliorer la réactivité.
Gestion des Changements et Coordination Interdisciplinaire
* Effectuer des qualifications opérationnelles pour valider la robustesse et la compatibilité des nouvelles versions avant leur déploiement en production.
* Participer aux revues techniques avec les experts IT, les équipes de cybersécurité, les développeurs et les services commerciaux afin d’anticiper les problématiques d’exploitation et d’intégration.
* Faciliter la communication entre les différentes parties prenantes, en assurant un rôle clé dans la coordination des évolutions techniques avec les besoins métiers.
* Assurer une veille technologique sur les innovations afin de recommander et d'implémenter des améliorations continues
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.