En quelques mots
Cherry Pick est à la recherche d'un "Machine Learning Engineer expert RAG" pour un client dans le secteur Bancaire
Description
🔍 Contexte & Objectifs
Nous recherchons un Data Scientist / Machine Learning Engineer spécialisé en Retrieval-Augmented Generation (RAG) pour concevoir et déployer des solutions innovantes basées sur l’IA générative et la recherche d’information. Vous travaillerez sur des données complexes et contribuerez activement à l’optimisation des pipelines RAG en structurant les données pour une recherche vectorielle efficace.
Vous maîtrisez les défis liés aux grands modèles de langage (LLM) et aux architectures RAG, et vous êtes capable de rédiger des RFP (Request for Proposal) pour comparer et choisir des solutions RAGaaS (RAG-as-a-Service) adaptées aux besoins de l’entreprise.
🚀 Missions principales
* Déployer des solutions RAG adaptées à des cas d’usage complexes, en optimisant la récupération et la génération d’informations.
* Structurer et indexer la donnée pour améliorer l’efficacité de la recherche vectorielle et réduire la latence.
* Gérer les défis des LLMs, notamment le contrôle des hallucinations, l’évaluation des réponses et la gestion du contexte.
* Explorer et comparer les solutions RAGaaS, rédiger des RFP pour identifier la meilleure architecture en fonction des besoins métier.
* Optimiser les pipelines de recherche en combinant LLMs, bases de données vectorielles et moteurs de recherche hybrides.
* Expérimenter et itérer sur différentes configurations de bases vectorielles (FAISS, Weaviate, Pinecone, ChromaDB…).
* Collaborer avec les équipes Data, Produit et Développement pour intégrer les modèles RAG dans les systèmes existants.
🛠️ Compétences requises
🔹 Machine Learning & LLMs
* Expérience en déploiement de solutions RAG sur des données complexes.
* Compréhension approfondie des LLMs et des défis liés à l’IA générative (hallucinations, grounding, context size…).
* Maîtrise des frameworks et API d’LLMs (LangChain, LlamaIndex, OpenAI, Hugging Face Transformers).
🔹 Recherche d’information & Bases vectorielles
* Excellente connaissance des modèles de recherche hybride (dense vs sparse retrieval).
* Expérience avec FAISS, Pinecone, ChromaDB, Weaviate, Milvus…
* Maîtrise des mécanismes d’indexation, de ranking et de scoring pour améliorer la pertinence des résultats.
🔹 Développement & Infrastructure
* Expérience avec Python, PyTorch/TensorFlow, FastAPI/Faust, Docker, Kubernetes.
* Connaissance des solutions cloud pour l’IA (AWS, GCP, Azure).
* Expérience en MLOps, monitoring et évaluation de modèles en production.
🔹 Stratégie & Sélection de Solutions
* Capacité à rédiger des RFP pour évaluer les solutions RAGaaS du marché.
* Expérience dans la comparaison de solutions open-source vs commerciales.
* Sensibilité aux enjeux de scalabilité, coût et performances des solutions RAG.
Mission Freelance
Longue durée
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.