L'analyse des données d'imagerie cérébrale basée sur l'apprentissage profond est très prometteuse pour l'aide à la décision clinique dans les troubles cérébraux (par exemple, la maladie d'Alzheimer, la maladie de Parkinson). Il s'agit d'un domaine de recherche très actif, avec de nombreux articles publiés chaque année (Colliot, 2023). Cependant, l'impact médical réel en termes de traduction dans les soins aux patients a été jusqu'à présent limité. Les résultats expérimentaux présentés dans les articles de recherche sont le plus souvent inadéquats pour répondre à deux questions clés pour la traduction clinique : i) avons-nous des garanties solides sur la performance de l'approche proposée ? ii) parmi les différentes approches d'apprentissage profond, avons-nous des preuves solides pour sélectionner celle qui est la plus performante ? Il y a plusieurs raisons sous-jacentes : i) procédures et résultats de recherche non reproductibles ; ii) montages expérimentaux inadéquats qui ne tiennent pas compte des spécificités de l'imagerie cérébrale ; iii) procédures de validation biaisées ; iv) statistiques inférentielles inadéquates ou inexistantes.
Notre équipe a été pionnière et a produit des travaux très cités sur l'évaluation reproductible et digne de confiance de l'apprentissage automatique pour le diagnostic assisté par ordinateur de la maladie d'Alzheimer (par exemple Samper-Gonzalez et al, 2018 ; Wen, Thibeau-Sutre et al, 2020). En particulier, nous avons dévoilé des procédures de validation biaisées, proposé des cadres pour les éviter, réalisé des benchmarks à grande échelle et créé une plateforme logicielle Open Source pour l'apprentissage profond reproductible en imagerie cérébrale, ClinicaDL (https://clinicadl.readthedocs.io/en/latest/). Cependant, d'importantes questions restent sans réponse, notamment l'intégration des statistiques inférentielles dans le cadre, la généralisation entre différents troubles, la prise en compte des données dépendantes (par exemple, la structure hiérarchique des données patient/scanner/hôpital) et la généralisation entre les ensembles de données.
S'appuyant sur ces efforts, ce projet de doctorat vise à obtenir un cadre méthodologique et expérimental général pour la validation et le benchmarking fiables et reproductibles des méthodes d'apprentissage profond dans l'imagerie cérébrale et la réalisation d'expériences à grande échelle. Les objectifs spécifiques sont les suivants :
- Enrichir le cadre avec des modèles d'apprentissage profond plus avancés, plus de tâches et plus d'ensembles de données
- Mieux prendre en compte les spécificités de l'imagerie cérébrale (acquisitions multiples dans le temps, scanners multiples, hôpitaux multiples, ensembles de données multiples, troubles multiples)
- Proposer un cadre statistique inférentiel adéquat pour la validation et la comparaison des modèles
- Réaliser des expériences de benchmarking entre les modèles, les tâches, les maladies et les ensembles de données de l'apprentissage profond (et aussi de l'apprentissage automatique standard) afin de créer une nouvelle norme pour la communauté
- Démontrer l'importance de tenir compte des spécificités de l'imagerie cérébrale lors de l'évaluation des modèles
- Mettre en oeuvre les approches dans un logiciel libre, en particulier ClinicaDL (https://clinicadl.readthedocs.io/), afin qu'elles puissent bénéficier à l'ensemble de la communauté scientifique.
References
- Colliot O (editor), Machine Learning for Brain Disorders, Springer, 2023. https://hal.science/hal-/document
- Wen J, Thibeau-Sutre E, Diaz-Melo M, Samper-González J, Routier A, Bottani S, Dormont D, Durrleman S, Burgos N, and Colliot O, Convolutional neural networks for classification of Alzheimer's disease : Overview and reproducible evaluation, Medical Image Analysis, 63, 101694, 2020. https://hal.science/hal-
- Samper-González J, Burgos N, Bottani S, Fontanella S, Lu P, Marcoux A, Routier A, Guillon J, Bacci M, Wen J, Bertrand A, Bertin H, Habert M-O, Durrleman S, Evgeniou T, and Colliot O, Reproducible evaluation of classification methods in Alzheimer's disease : Framework and application to MRI and PET data, NeuroImage, 183 :504-521, 2018. https://inria.hal.science/hal-v2/file/AD_ML_manuscript_postprint.pdf
Contexte de travail
Vous travaillerez au sein de l'équipe ARAMIS (www.aramislab.fr) de l'Institut du cerveau (CNRS UMR 7225) de Paris. L'institut est idéalement situé au coeur de l'hôpital de la Pitié-Salpêtrière, au centre de Paris.
L'équipe ARAMIS se consacre au développement de nouvelles approches informatiques pour l'analyse de grands ensembles de données cliniques et de neuroimagerie. Avec environ 35 personnes, l'équipe a une composition multidisciplinaire, réunissant des chercheurs en apprentissage machine et en statistiques et des médecins (neurologues, neuroradiologues).
Pour plus d'informations, merci de contacter Olivier Colliot (https://www.aramislab.fr/perso/colliot/)
Contraintes et risques
Pas de contraintes particulières
La thèse sera rattachée à l'école doctorale EDITE (https://www.edite-de-paris.fr/spip/)
Informations complémentaires
Compétences souhaitées
- Master ou école d'ingénieur avec une spécialisation en machine learning et statistiques
- Bon niveau de programmation en Python
- Très bonnes qualités rédactionnelles
- Très bonnes qualités de communication
- Capacité à collaborer efficacement avec d'autres membres de l'équipe
Documents à fournir
Les candidatures devront inclure un CV détaillé; au moins deux références (personnes susceptibles d'être contactées) ; une lettre de motivation d'une page.
Contact
Olivier Colliot - http://www.aramislab.fr/perso/colliot/ - @.**.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.