Au cœur des enjeux de la planète, CLS, Tech4Good company, filiale du CNES et de la CNP, est une société à mission internationale, pionnière dans la fourniture de solutions d’observation et de surveillance de la Terre.
Opérateur historique des balises Argos, CLS, depuis 1986, avec plus de 900 salariés dans 30 pays et un chiffre d’affaires annuel de plus de 173 millions d’euros, figure parmi les spécialistes des services satellitaires en utilisant les technologies spatiales les plus avancées, couplées au génie logiciel et à la data-sciences.
Vous souhaitez rejoindre des équipes agiles et dynamiques sur des projets innovants et ambitieux? Explorer de nouvelles technologies? Evoluer sur des projets transverses et variés autour des 5 secteurs d’activité de CLS?
Ceci est possible au sein de notre Direction Systèmes d'Informations (DSI), dont le défi, pour soutenir la croissance de CLS, est de bâtir un socle solide et partagé au sein du groupe pour l’ensemble de ses systèmes et services actuels et futurs!
Au sein de la DSI, le département OPERATIONS assure le maintien en conditions opérationnelles, la fiabilité, la disponibilité et la performance des logiciels et des systèmes fournissant l'ensemble des services de CLS.
A propos du poste
Dans ce contexte, nous recherchons pour renforcer nos équipes un :
Ingénieur SRE - DevOps (F/H)
Vous jouerez un rôle central dans la gestion, la disponibilité et la résilience d’un ou plusieurs services clients. Vous serez responsable d’automatiser, de surveiller et d’améliorer continuellement la fiabilité des systèmes critiques 24/7 de CLS hébergés dans le cloud et/ou on premise.
Votre mission inclut la gestion proactive des incidents, la réduction du temps moyen de réparation et l’amélioration des indicateurs clés de fiabilité (SLO, SLA, SLIs) pour garantir des opérations fluides et une disponibilité optimale des services proposés à nos utilisateurs.
Ce rôle, tout en étant hautement technique, se trouve au cœur de nombreux métiers et requiert une forte capacité de coordination interdisciplinaire.
Dans ce cadre, vos missions principales seront :
Maintien en Conditions Opérationnelles
* Garantir la disponibilité et la performance des services en production dans un contexte 24/7.
* Gérer les incidents majeurs et piloter leur résolution rapide pour limiter l’impact sur les opérations.
* Assurer un rôle de support opérationnel de niveau 2, en travaillant en étroite collaboration avec les opérateurs H24, qui assurent la supervision et les premières analyses d’alertes.
* Collaborer avec les équipes IT et les développeurs pour identifier les causes profondes des incidents et mettre en place des actions correctives et préventives.
Observabilité et fiabilisation
* Mettre en place des outils de monitoring et d’alerting performants et pertinents (Grafana, CentreOn, NAGIOS)
* Définir et suivre les indicateurs de fiabilité (SLI/SLO/SLA) afin d’améliorer en continu la qualité de service.
* Participer à la conception et à la définition des architectures des applications pour renforcer la résilience et minimiser les incidents.
* Automatiser les processus de déploiement, de remédiation et d’exploitation pour réduire la charge opérationnelle et améliorer la réactivité.
Gestion des Changements et Coordination Interdisciplinaire
* Effectuer des qualifications opérationnelles pour valider la robustesse et la compatibilité des nouvelles versions avant leur déploiement en production.
* Participer aux revues techniques avec les experts IT, les équipes de cybersécurité, les développeurs et les services commerciaux afin d’anticiper les problématiques d’exploitation et d’intégration.
* Faciliter la communication entre les différentes parties prenantes, en assurant un rôle clé dans la coordination des évolutions techniques avec les besoins métiers.
* Assurer une veille technologique sur les innovations afin de recommander et d'implémenter des améliorations continues.
A propos du profil recherché
De formation supérieure en informatique, ingénierie système ou équivalent, vous détenez une première expérience réussie de 3 à 5 ans en exploitation, fiabilisation ou ingénierie système/SRE.
Compétences Techniques
* Expérience en exploitation et fiabilisation de systèmes critiques dans un environnement 24/7.
* Bonne maîtrise des environnements Linux et des bases de données PostgreSQL.
* Expérience avec les infrastructures Cloud AWS/Azure.
* Maîtrise des outils de monitoring et d’alerting (Grafana, NAGIOS).
* Pratique des solutions d’automatisation, d’IaC (Terraform, Ansible), de conteneurisation et orchestration (Docker, Kubernetes).
* Connaissances du fonctionnement Kafka.
Compétences Transverses et de Coordination
* Forte capacité d’analyse et de résolution de problèmes dans un environnement critique.
* Rigueur, proactivité et sens aigu des responsabilités.
* Excellentes compétences en communication avec la capacité de dialoguer et de fédérer autour d’objectifs communs, même au sein d’équipes pluridisciplinaires.
Affinité avec la culture DevOps/SRE et une véritable appétence pour l’amélioration continue.
Nous sommes impatients de vous rencontrer pour discuter de votre avenir chez CLS ! Rejoignez-nous pour construire des systèmes fiables et performants au service d’opérations critiques en 24/7.
Avantages salariaux
* Restaurant d’entreprise
* Télétravail
* Reconnaissance (Intéressement avec abondement, primes exceptionnelles, primes de cooptation)
* Politique d’entreprise en faveur de la diversité, de l'égalité professionnelle et de l'emploi des travailleurs handicapés
* Compte épargne temps
* CSE attractif (sport, participation voyages, etc…)
* Package régime de Santé Mutuelle et Prévoyance très favorable (participation employeur élevée)
* Parking à vélo et borne de recharge véhicules électriques
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.