Responsable d’application SRE – Secteur Média (H/F)
Description du poste
Vos missions :
En tant que Responsable d’Application SRE, vous serez le garant de la fiabilité, de la performance et de la scalabilité de nos applications. Vos principales missions seront :
Gestion de la Fiabilité des Applications :
* Assurer la disponibilité, la performance et la capacité des applications en production.
* Mettre en œuvre des pratiques SRE pour améliorer la fiabilité et réduire les temps d’arrêt.
Automatisation et Monitoring :
* Développer et maintenir des outils d’automatisation pour les déploiements, la gestion des configurations et les opérations courantes.
* Mettre en place des solutions de monitoring et d’alerting pour surveiller en temps réel les performances des applications.
Gestion des Incidents et des Problèmes :
* Gérer les incidents de production, analyser les causes profondes et mettre en œuvre des actions correctives.
* Participer à des revues post-incidents pour identifier les opportunités d’amélioration.
Optimisation des Performances :
* Analyser les performances des applications et identifier les goulots d’étranglement.
* Optimiser les ressources et les configurations pour améliorer l’efficacité et la rapidité des applications.
Collaboration et Coordination :
* Travailler en étroite collaboration avec les équipes de développement, d’infrastructure et de support pour garantir une intégration fluide des solutions.
* Participer aux réunions et projets transversaux pour améliorer les infrastructures et les processus.
Documentation et Formation :
* Rédiger et maintenir une documentation technique détaillée des configurations, des processus et des procédures.
* Former les équipes internes sur les meilleures pratiques SRE et les outils utilisés.
Gestion de Projet et Leadership :
* Piloter des projets d’amélioration continue pour augmenter la fiabilité et la performance des applications.
* Fournir un leadership technique et mentorat aux membres de l’équipe SRE.
Votre profil :
* Diplôme d’ingénieur ou master 2 en informatique, génie logiciel ou dans un domaine connexe.
* Minimum de 5 ans d’expérience professionnelle en ingénierie de fiabilité des sites (SRE) ou en administration de systèmes.
* Solides compétences en administration des systèmes Linux/Unix.
* Expérience en développement de scripts et d’outils d’automatisation (Python, Shell, Ansible, etc.).
* Connaissance approfondie des technologies de monitoring et d’alerting (Prometheus, Grafana, ELK, etc.).
* Excellentes compétences en résolution de problèmes, analyse de performance et gestion des incidents.
Atouts supplémentaires :
* Expérience avec des environnements cloud (AWS, Azure, Google Cloud) et leurs outils SRE.
* Connaissance des pratiques DevOps et des outils CI/CD (Jenkins, GitLab CI, etc.).
* Certifications pertinentes (Google SRE, AWS Certified DevOps Engineer, etc.).
Informations supplémentaires
Si vous êtes un expert en SRE, passionné par l’optimisation des applications et doté d’une solide expérience en gestion de fiabilité, nous serions ravis de recevoir votre candidature.
Rejoignez-nous et participez à une mission passionnante pour fournir des applications performantes et fiables.
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.