Au sein d’une équipe d’ingénieurs de l’équipe Logica et sous la responsabilité de son coordinateur scientifique, vous contribuerez au déploiement des projets RAGaRenn et ILaaS. Vous assurerez la mise en place de logiciels et méthodes liés aux moteurs d’inférence des LLM open-source des projets. Vous contribuerez à assurer le maintien en conditions opérationnelles des solutions retenues.
Vous interagirez avec les partenaires et porteurs de ces projets, en particulier avec la Direction du Système d’Information (DSI) et avec les interlocuteurs techniques du datacenter régional labellisé Eskemm Data.
Vos activités principales:
- Contribuer au stockage, workflows et à l’analyse de données
- Intégrer des frameworks d’inférence tels que vLLM ou équivalents.
- Concevoir et déployer une architecture modulaire basée sur des microservices pour l’inférence de LLM
- Développer des outils d’orchestration et d’optimisation des flux de données pour améliorer la scalabilité et la performance
- Assurer la compatibilité avec des infrastructures de calcul distribuées (GPU, clusters HPC)
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.