Descriptif du stage
En tant que stagiaire Data Ingénieur / Data Scientist, tu accompagneras nos experts dans la construction d’assistants conversationnels basés sur l’Intelligence Artificielle générative et sur des références scientifiques fiables, à destination de chercheurs et d’ingénieurs (cf. site web : https://emeritscience.com).
L’objectif du stage est de concevoir intégrer et optimiser, pour notre assistant conversationnel Charlie, un système RAG (Retrieval Augmented Generation) basé sur des modèles open source de vectorisation et de génération de textes avec des performances équivalentes ou supérieurs aux modèles propriétaires.
Pour cela, tu travailleras en étroite collaboration avec nos équipes tech et produit, ainsi qu’avec des partenaires technologiques externes.
Le stage pourra évoluer en thèse Cifre (thèse en entreprise)
Tes missions principales :
* Benchmark et veille technologique
* Réalisation d’un benchmark sur les méthodes RAG avec une stack open source (vectorisations, search engines, modèles d’IA générative, cross encoders, …).
* Identification des métriques de scoring, de datasets et de librairies utilisables pour l’évaluation de la qualité des systèmes RAG dans notre contexte.
* Automatisation du processus de veille sur les composants retenus.
* Développement de chaînes de traitements d’acquisition de grands volumes de données
* Design et mise en œuvre de chaînes de traitements big data pour collecter et caractériser des données (acquisition, nettoyage, préparation, analyse qualité et visualisation des données de sources hétérogènes, structurées et non structurées).
* Automatisant des traitements.
* Support aux choix des méthodes RAG et des paramétrages à appliquer en fonction des cas d’usage.
* Développement de méthodes de scoring adaptées à notre contexte
* Construction du score d’évaluation globale ainsi que les scores intermédiaires (recherche, génération, éthique).
* Calcul des scores avant la mise en production, et en automatisation du calcul en production et en fonction de langues.
* Participer au Réalisation de fine tuning de modèles open source
* Optimisation des traitements pour maitriser les coûts et la qualité
* Documentation de l’ensemble des réalisations pour assurer la reproductibilité et la traçabilité
Profil recherché
* Tu es en fin d’étude BAC+5 d’un diplôme d’ingénieur ou un master dans un domaine pertinent (data-science, data-ingénieur, ingénierie, sciences et technologie, mathématique appliquées)
* Tu envisages de poursuivre en doctorat (thèse cifre possible)
* Tu as de solides compétences en programmation, en particulier en Python, avec une expérience pratique dans l’utilisation de bibliothèques telles que langchain, scikit-learn, TensorFlow, Keras ou PyTorch.
* Tu as des connaissances en intelligence artificielle et une bonne compréhension des méthodes de traitements et d’analyse de données à grande échelle en particulier le text-mining.
* Tu connais les méthodologies de développement agile de produits (scrum et kanban).
* Tu connais les processus collaboratifs et outils de développement (DevOps, Git, CI/CD, Jira, Confluence …).
* Tu possèdes un bon niveau en anglais.
* Tu as une vraie soif d’apprendre
Stack technique :
- Python, Shell, R, SQL
- Scikit-learn, Langchain, Hugging Face
- Dataiku, Notebooks
- Bitbucket, Jira, Confluence
- Cloud AWS, Azure et High Performance Computing (HPC)
Localisation :
- Bureaux à Rouen ou à Caen
- Télétravail possible
Salaire :
- 660€
- 50% carte de transport
Infos complémentaires :
- Ceci est un stage pré embauche
- Un environnement de travail dynamique et bienveillant, au sein d’une équipe expérimentée dans le déploiement de solutions d’IA
- Développement sous mac
Contact : contact@emeritscience.com
Type d'emploi : Stage
Durée du contrat : 6 mois
Rémunération: 660,00€ par mois
Avantages:
* Prise en charge du transport quotidien
* RTT
* Travail à domicile occasionnel
Horaires:
* Du lundi au vendredi
Capacité à faire le trajet ou à déménager:
* 76000 Rouen: Faire le trajet sans problème ou prévoir un déménagement avant de prendre son poste (Requis)
Question(s) de présélection:
* Pouvez vous vous rendre à nos locaux de Rouen au moins une fois par semaine ?
* Quand votre stage conventionné peut-il commencer ?
* Recherchez vous bien un stage de fin d'étude (niveau bac+5) de 6 mois CONVENTIONNE avec votre école/ université ? Vous devrez nous présenter votre convention de stage.
Formation:
* Bac +4 (Maîtrise) (Requis)
Lieu du poste : Télétravail hybride (76000 Rouen)
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.