Piloter techniquement le projet de développement de l'outil REINDEER, programme de bioinformatique permettant à des non spécialistes de créer et d'interroger leurs propres index de séquences notamment sur des questions liées à la santé.
Activités
-Piloter le projet de développement de l'outil en apportant des améliorations techniques et en ajoutant des fonctionnalités
-Collaborer avec les équipes de recherches et apporter une expertise dans l'utilisation des méthodes mathématiques et des techniques informatiques pour la modélisation et la simulation d'un phénomène physique
- Faciliter les I/O, paramétrage, documentation technique et utilisateur.
- Automatisation de tests unitaires et fonctionnels, tests de performance.
- Packaging, installation via conda ou pip. Mise en place d’intégration continue.
- Aide au déploiement d'index dans les équipes partenaires.
- Développement d’une API REST afin de faciliter l’interfaçage avec l'outil, notamment pour l’interrogation d’index via des interfaces web.
Compétences
- expert en bioinformatique des séquences, arbres de de Brujn, indexation de séquences
- Maîtrise de la programmation en C/C++ ou Rust
- Bases de programmation Web
- Mathématiques
-outils de calcul scientifique
- Méthodologie de conduite de projet
- Langue anglaise : B2 à C1 (cadre européen commun de référence pour les langues)
- Piloter un projet
- Mettre au point ou adapter des techniques nouvelles
- Programmer dans différents environnements informatiques
- Accompagner et conseiller
- Communiquer et faire preuve de pédagogie
Contexte de travail
Reindeer permet d’associer à large échelle des ARNs à leurs abondances dans un grand nombre de conditions expérimentales. Pour cela, il indexe des jeux de données de séquençage ARN correspondant à différentes conditions dans une grande banque de données (plusieurs milliers de jeux). Reindeer permet ensuite la fouille de ces banques de manière efficace, et a été le premier à le faire à large échelle (en 2020)(1). Il est ainsi possible de mesurer très rapidement la présence et l’abondance de fragments d’ARN dans des milliers d’échantillons. Nous avons récemment montré l'utilité de Reindeer dans la recherche en cancérologie (2). Son successeur Reindeer2 améliore sensiblement ses performances, permettant un passage à l’échelle sur des collections de 10000 jeux de données ou plus.
L'ingénieur exercera ses missions en partie à l'I2BC Gif sur Yvette (Ile de France-Essonne) et au laboratoire CRIStAL (Lille).
Références:
1. Marchet C, Iqbal Z, Gautheret D, Salson M, Chikhi R. (2020) REINDEER: efficient indexing of k-mer presence and abundance in sequencing datasets Bioinformatics. 36(suppl.). i177-i185. https://doi.org/10.1093/bioinformatics/btaa487
2. Bessière C, Xue H, Guibert B, Boureux A, Rufflé F, Viot J, Chikhi R, Salson M, Marchet C, Commes T, Gautheret D. (2024) Transipedia.org: k-mer-based exploration of large RNA sequencing datasets and application to cancer data. Genome Biol. 25:266. https://doi.org/10.1186/s13059-024-03413-5
Reindeer permet d’associer à large échelle des ARNs à leurs abondances dans un grand nombre de conditions expérimentales. Pour cela, il indexe des jeux de données de séquençage ARN correspondant à différentes conditions dans une grande banque de données (plusieurs milliers de jeux). Reindeer permet ensuite la fouille de ces banques de manière efficace, et a été le premier à le faire à large échelle (en 2020)(1). Il est ainsi possible de mesurer très rapidement la présence et l’abondance de fragments d’ARN dans des milliers d’échantillons. Nous avons récemment montré l'utilité de Reindeer dans la recherche en cancérologie (2). Son successeur Reindeer2 améliore sensiblement ses performances, permettant un passage à l’échelle sur des collections de 10000 jeux de données ou plus.
L'ingénieur exercera ses missions en partie à l'I2BC Gif sur Yvette (Ile de France-Essonne) et au laboratoire CRIStAL (Lille).
Références:
1. Marchet C, Iqbal Z, Gautheret D, Salson M, Chikhi R. (2020) REINDEER: efficient indexing of k-mer presence and abundance in sequencing datasets Bioinformatics. 36(suppl.). i177-i185. https://doi.org/10.1093/bioinformatics/btaa487
2. Bessière C, Xue H, Guibert B, Boureux A, Rufflé F, Viot J, Chikhi R, Salson M, Marchet C, Commes T, Gautheret D. (2024) Transipedia.org: k-mer-based exploration of large RNA sequencing datasets and application to cancer data. Genome Biol. 25:266. https://doi.org/10.1186/s13059-024-03413-5
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.