Fondée en 2020, SustainEcho est la première plateforme qui utilise l'IA pour automatiser le calcul des analyses de cycle de vie des bâtiments directement à partir des métrés. Notre mission est de permettre à toutes les entreprises de la construction (promoteurs, constructeurs, bureaux d'études) de s'engager sur la réduction de l'impact carbone de leurs projets, un secteur qui représente aujourd'hui 30% des émissions en France. Nous mettons la Data Science et le Machine Learning au coeur de notre application pour démocratiser la réalisation de ces études complexes et essentielles. SustainEcho est utilisé par les plus grands acteurs du BTP en France tels que Bouygues Construction, Vinci Construction, Demathieu & Bard, Spie Batignolles, Egis, afin de réaliser des projets plus vertueux et définir leur stratégie carbone. Cela nous a permis d'être labellisés GreenTech Innovation par le Ministère de la Transition Écologique. Pour accélérer notre développement, SustainEcho a rejoint le groupe Egis début 2023, ce qui nous permet de coupler nos capacités de développement logiciel agiles avec l'expertise métier et sectorielle du groupe Egis, leader de l'ingénierie en France. Chez Egis, nous développons une solution utilisée par des milliers de collaborateurs afin d'améliorer leur quotidien. Notre travail couvre, entre autres, l'analyse de gros documents multilingues, l'extraction d'information et la réponse aux questions à grande échelle. Au sein de l'équipe Machine Learning, vous serez chargé(e) de travailler sur l'évaluation et l'amélioration de notre pipeline RAG (Retrieval-Augmented Generation). Ce pipeline, qui combine ingestion de documents, embedding, recherche d'information, et re-ranking, est au coeur de nos solutions d'IA.
L'objectif principal de ce stage est de garantir la qualité et la fiabilité des résultats produits par ce pipeline à travers une meilleure compréhension, évaluation, et optimisation de ses différentes étapes.
Encadré(e) par des experts en Machine Learning, vos responsabilités incluront :
· Étudier et comprendre chaque composant clé (document digestion, embedding, retriever, reranker, etc.) du pipeline RAG.
· Explorer l'état de l'art pour identifier les meilleures métriques adaptées à chaque étape du pipeline.
· Développer des datasets spécifiques pour évaluer les performances de nos modèles et méthodes.
· Construire une solution pour automatiser les tests dans une approche d'intégration et déploiement continus (CI/CD).
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.