About the role
Votre rôle consiste à effectuer un travail de thèse sur le thème « l’IA Générative pour la Sécurité SOC : Détection et Réponse Automatisée ». Orange a choisi de faire de la cybersécurité l’un de ses axes majeurs de développement. Dans ce contexte, les centres opérationnels de sécurité (SOC) jouent un rôle crucial en surveillant et en répondant aux incidents de sécurité. Actuellement, la détection et la réponse aux incidents reposent sur l’analyse de grands volumes de données, souvent hétérogènes et complexes. Les analystes de sécurité sont confrontés à des défis tels que la détection des mouvements latéraux, la classification des alertes et l’automatisation des chasses aux menaces. L’utilisation de modèles d’IA génératives (LLM) pour améliorer ces processus est une voie prometteuse [1,2,3].
Les défis principaux incluent la modélisation des données SOC, le traitement des données non supervisées et la scalabilité des algorithmes. Les logs collectés sont souvent hétérogènes et non standardisés, ce qui complique leur analyse. Des techniques de recommandation [7] ou de traitement du langage naturel (NLP) comme word2vec [4,6] peuvent aider au parsing automatique, à la détection d’anomalies et à l’identification de signaux faibles. L’objectif est d’extraire des indicateurs de cybersécurité pertinents pour les analystes en garantissant la robustesse [5], l’efficacité et la souveraineté des modèles utilisés.
Objectifs
1. Méthodes de Prétraitement des Données : Utiliser des techniques de NLP pour le parsing automatique des logs
2. Extraction de Métadonnées Pertinentes : Développer des algorithmes pour trier/classifier les alertes & automatiser les chasses
3. Évaluation : Quantifier la pertinence des métadonnées sur des datasets internes/externes
4. Développement de LLMs Souverains : Construire des modèles spécifiques aux données cyber d’Orange
Verrous
1. Échelle : traiter des volumes massifs de logs
2. Interfaçage LLMs : connecter les agents et les outils de sécurité
3. Robustesse/Souveraineté : garantir la sécurité et la maîtrise des modèles développés
Références
1. Minaee H. et al. « Large language models: A survey » 2024
2. Capodieci N. et al. ‘The Impact of Generative AI and LLMs on the Cybersecurity Profession’ 2024 Systems and Information Engineering Design Symposium, 2024
3. Motlagh F. N. et al. ‘Large language models in cybersecurity: State-of-the-art’ 2024
4. Mendsaikhan O. et al. ‘Identification of cybersecurity specific content using the Doc2Vec language model,’ 2019 IEEE 43rd Annual Computer Software and Applications Conference
5. Liu Y. et al. ‘Prompt Injection attack against LLM-integrated Applications’ 2023
6. Roy A. et al. ‘Learning domain-specific word embeddings from sparse cybersecurity texts’ 2017
7. Brisse R. et al. ‘KRAKEN: A Knowledge-Based Recommender system for Analysts, to Kick Exploration up a Notch’ 14th International Conference on Security for Information Technology and Communications
about you
Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste
- Bonnes connaissances en mathématiques (théorie des transformers, deep learning…) est un plus
- Connaissance en programmation python sur les librairies standard (Scikit-learn, tensorflow, pandas, etc…) et envie de s’intégrer dans un écosystème industriel
- Connaissance sur le domaine de la cybersécurité ou envie de découvrir le sujet
- Bon niveau de rédaction français/anglais et bon niveau de communication/vulgarisation
- Une des nationalités d’un des pays membres de l’espace Schengen est requise pour ce poste
Formation demandée (master, diplôme d’ingénieur, doctorat, domaine scientifique et technique …)
- Master ou école d’ingénieur, avec au moins deux des trois spécialités : Développement informatique, IA ou Cybersécurité
Expériences souhaitées (stages, …)
- Stage de M2 en recherche sur un sujet connexe (cybersécurité ou IA)
Vous parlez couramment français et vous savez vous exprimer en anglais.
A noter que pour des raisons de sécurité, cette offre est réservée à des ressortissants de l'espace Schengen.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.