Votre rôle
Votre rôleest d’effectuer une thèse surl’«Intégration et la traçabilité des connaissances dans un système de Q/A basé sur GraphRAG »
Contexte global et problématique
L'essor des agents conversationnels a transformé la manière dont les informations sont recherchées. Des outils comme Le Chat ou ChatGPT ont démontré leur efficacité dans des tâches de recherche d'information. Cependant, ces outils rencontrent des limites lorsqu'il s'agit de mobiliser des connaissances à jour et spécifiques à l'entreprise. Cette lacune génère une demande pour des solutions capables d'exploiter des bases internes à l’entreprise. Les graphes de connaissances d'entreprise (EKG) émergent comme une source stratégique couvrant les domaines de l'entreprise. Ces graphes offrent un potentiel certain pour améliorer la précision et la traçabilité des systèmes de recherche d'information. Cependant, l'intégration efficace de ces graphes avec les modèles de langage larges (LLM) reste un défi majeur.
Objectif scientifique
La problématique centrale est d'améliorer la robustesse, la précision, la traçabilité et l'autonomie d'un système de recherche d'information basé sur une synergie entre un LLM et un EKG en utilisant une architecture de type GraphRAG. Cette approche vise à surmonter les limitations des outils d'IA Générative (e.g. hallucination, défiance, obsolescence des informations) en exploitant les connaissances spécifiques et à jour de l'entreprise.
Un des défis clés est l'injection équilibrée des connaissances, en évitant le problème d'information « lost in the middle ». Par ailleurs, la confiance des utilisateurs dans le système est un facteur crucial pour son adoption. Il est donc essentiel de concevoir un mode de fonctionnement qui renforce cette confiance tout en incitant les utilisateurs à contribuer à l'enrichissement des graphes de connaissances. Enfin, l'autonomie des agents LLM peut être améliorée par une meilleure compréhension des intentions de l'utilisateur et l'orchestration de modèles spécialisés pour des tâches spécifiques. Les réponses apportées aux utilisateurs peuvent être de plus en plus personnalisées au fur et à mesure de l’usage et de la prise en compte de l’historique des interactions passées.
Les objectifs de cette thèse sontcristallisés dans les tâches ci-dessous:
* Affiner la collecte des contextes par un agent orchestrateur et explorer de nouvelles méthodes de re-ranking tirant parti du graphe de connaissances;
* Implémenter des mécanismes pour gérer la traçabilité et la transparence des réponses générées via la mise à disposition des sources et définir une boucle vertueuse entre collecte des retours utilisateur, modification du graphe et mise à jour du moteur de recherche d’information;
* Travailler la compréhension de l’intention de l’utilisateur et la définition d’un plan d’actions complexe ;
* Concevoir, développer et déployer un prototype de service rendant plus exploitable les données de l’entreprise.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.