Application des systèmes multi-agents pour la fouille documentaire : optimisation des performances des OCRs dans l'extraction de données textuelles
Avec près de 2000 collaborateurs de 29 nationalités, EDF Lab Paris Saclay travaille sur plus de 250 projets de recherche et de développement qui visent à répondre aux enjeux du Groupe EDF d'aujourd'hui et aux évolutions de demain.
Dans ce cadre, au sein du Département PERICLES (PErformance et prévention des Risques Industriels du parC par la simuLation et les EtudeS), le groupe ARTEMIS réunit les compétences de modélisation / interaction 3D et d'analyse visuelle de données et d'intelligence artificielle. Le projet PING (Performance des INGénieries) mène des activités de développement d'outils innovants pour rendre la documentation intelligente.
Cette documentation se compose de plans, essentiellement sous forme de documents images, qui sont organisés selon une architecture complexe, chaque plan faisant référence à une dizaine d'autres plans apportant des informations sur la continuité de celui-ci (plans voisins) ou des informations complémentaires (plans de différentes typologies ; schémas mécaniques, électriques). Les installations électronucléaires d'EDF ayant entre 20 et 40 ans, la documentation historique a été pensée pour une gestion papier et non informatique. Aujourd'hui, les plans sont très chronophages à exploiter ; la ressaisie de toutes les informations relatives au plan, localisation (bâtiment, local), numéros de contrat, applicabilité sur les technologies ou sur les unités de production concernées sont assez variables en fonction de l'année d'édition du document et cette ressaisie n'a pas forcément été réalisée exhaustivement.
Le lot Fouille Documentaire du projet PING (Performance des Ingénieries) cherche à améliorer les performances d'une IA de type OCR permettant de détecter des références dans des corpus de documents pdfs non-intelligents. Plusieurs OCR sont actuellement disponibles, avec des bonnes performances. Il n'en reste pas moins qu'ils peuvent produire des hallucinations pouvant coûter cher.
Pour améliorer les performances de prédiction, l'équipe R&D cherche à investiguer l'usage d'algorithmes de consensus pour fiabiliser les prédictions. Ces algorithmes permettent d'assurer un consensus au sein d'un réseau, avec certaines garanties de fiabilité malgré la présence de noeuds malveillants (ou qui produisent des hallucinations pour une IA). L'une des difficultés est de s'affranchir d'entrainements, d'où l'idée d'explorer des algorithmes d'IA multi-agents qui échangent entre elles et produisent des réponses les plus performantes possibles, plutôt que des modèles de types soupe d'experts.
Plusieurs frameworks sont disponibles aujourd'hui pour pouvoir mettre en place des IA multi-agents avec différents degrés d'autonomies : Autogen de Microsoft, LangGraph de LangChain, smolagents d'HuggingFace, etc.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.