DXOMARK est le leader mondial dans le développement d'outils et de méthodes d'évaluation de la qualité des dispositifs multimédias. Nous équipons et conseillons les plus grandes marques pour qu'elles puissent évaluer scientifiquement les performances des appareils photo, de l'audio, de l'écran et de la batterie des produits de demain. De la Silicon Valley à l’Asie de l’Est, nos équipes partagent leur expertise avec les fabricants pour les aider à développer des produits plus performants. L’excellence au service de la qualité !
Depuis plus de 20 ans, la division Camera évalue et teste appareils photo professionnels, smartphones, caméras de sécurité, drones, automobiles, etc. Les appareils photo tels que les smartphones disposent de pipelines complexes qui s'adaptent au contenu de la scène, rendant les mesures en laboratoire insuffisantes pour une évaluation complète de la caméra. Des équipes d'experts en Qualité d'Image sont chargés chez tous les fabricants, d'effectuer des évaluations perceptuelles d'images de scènes naturelles. Ce processus est très chronophage. IQE expérimente l'utilisation de l'apprentissage automatique pour les automatiser.
MISSION
L'iQA (Image Quality Assessment) est l'estimation automatique de la qualité d'une image, autrement dit, de la capacité des caméras à reproduire un contenu de qualité. La perception humaine servant de référence, ces méthodes doivent évaluer différentes caractéristiques perceptuelles de la représentation de l'image telles que la reproduction des couleurs, le rendu du bruit, la représentation de la texture, etc.
L'équipe de Machine Learning travaille sur des outils permettant d'automatiser l'évaluation de la qualité d'image de caméras de smartphones. Le stage proposé se concentre sur une technologie appelée modèles de langage multimodaux de grande taille. Ces modèles sont capables de comprendre à la fois du texte (comme des descriptions ou des données) et des images. Le projet consiste à voir comment ces modèles peuvent aider à prédire la qualité des images, c'est-à-dire déterminer si une photo est nette, bien exposée, ou fidèle aux couleurs, par exemple.
Le projet du stage proposé consiste à étudier la capacité de nouveaux modèles de langage multimodaux de grande taille à traiter la prédiction de la qualité d’image. Le stagiaire devra entraîner ces modèles à partir de bases de données, comprenant des images et des descriptions associées, pour les adapter aux besoins spécifiques de DXOMARK. Le stagiaire devra affiner les LMMs généraux sur des bases de données publiques et internes en suivant des techniques comme QAlign (https://openreview.net/forum?id=PHjkVjR78A).
PROFIL
* Vous suivez une formation Ingénieur spécialisé en Computer Vision, Traitement d'Images ou Machine Learning et vous avez eu l’occasion de travailler (projets, stages, Kaggle) sur le développement de modèles d'apprentissage automatique pour Computer Vision.
* Vous maitrisez Python (PyTorch).
* Vous avez une forte appétence pour les mathématiques appliquées.
* Vous parlez couramment anglais (l'équipe est composée de 6 nationalités différentes).
* Un fort intérêt pour la photographie enrichira considérablement votre expérience !
Stage de 5-6 mois basé à Boulogne-Billancourt à partir de Q1 2025.
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.