Data Engineer — H/F
Au sein du Département d'Epidemiologie, de Biostatistique et des Données de Santé, en tant que Data engineer, vous aurez la responsabilité de créer les pipelines de flux de données (structurées et non structurées) vers l'entrepot de données de santé en construction au Centre Antoine Lacassagne. Vous aurez d'étroites relations avec les équipes de data management, data science et informatique (infrastructure, sécurité et opérationnelle).
Vos principaux objectifs sont de développer, maintenir et améliorer les solutions et infrastructures data nécessaires à la collecte, la centralisation, le stockage et l’accès aux données de santé collectées au sein du Centre Antoine Lacassagne (CAL).
Vous travaillerez majoritairement sur des données de santé de vie réelle. Ces données sont générées à l’occasion des soins réalisés en routine pour un patient au sein du CAL. Ces données peuvent provenir de multiples sources : dossier patient informatisé (DPI), logiciels de prise en charge (pharmacie, imagerie, anatomopathologie, oncopharmacologie, chirurgie, oncologie), informations utilisées pour le remboursement de soins, collecte spécifique permettant de créer des registres ou des cohortes ou des Entrepôts de Données de Santé (EDS), réseaux sociaux, objets connectés, etc.
Missions principales :
-Concevoir efficacement et maintenir des flux d’intégration (collecte, Ingestion, Stockage) permettant de centraliser les données issues de plusieurs sources dans un entrepôt de données de santé tout en garantissant une qualité de données.
-Mettre en place des pipelines de données sécurisées qui seront traitées et nettoyées par les data managers pour délivrer des bases « gelées » mises à disposition des experts scientifiques, biostatisticiens et data scientists.
-Concevoir et mettre en œuvre un process et un data pipeline permettant de valider la qualité des données intégrées automatiquement dans l'Entrepôt de données de Santé, par confrontation avec les données intégrées à partir de collecte manuelle.
-Assister les data scientists spécialistes de la structuration de données non structurées issues de compte-rendu médicaux ou fiche RCP (Réunion de Concertation Pluridisciplinaire) ou documents du DPI, avec des solutions de type Natural Language Processing (NLP).
-Rédiger et mettre à disposition la documentation (guide de procédure, documents utilisateurs, référentiels, …) et participer au dépôt du dossier de l'EDS
-Communication/collaboration avec les pilotes des différents projets : reporting auprès des managers hiérarchiques et de la direction
-Connaissances de SQL, Python (Pandas, Numpy, …), PL/SQL (option)
-Bases relationnelles
-Connaissances des données médicales
-Bonne compréhension du cycle de vie de la donnée et de la data privacy
-Capacité à réconcilier de nombreuses sources de données hétérogènes
-Notions en FHIR serait un plus
-Notions en OMOP serait un plus
-Notions en OSIRIS RWD serait un plus
Centre Antoine-Lacassagne
Fondé en 1961 et situé à Nice, le Centre Antoine Lacassagne est un des 18 Centres de Lutte Contre le Cancer français, membre du Groupe UNICANCER.
Etablissement de santé de droit privé à but non lucratif et reconnu d’utilité publique (statut ESPIC - Etablissement de Santé Privé d’Intérêt Collectif), le Centre Antoine Lacassagne remplit des missions de service public en cancérologie :
- Soins : prévention, dépistage, traitement et réinsertion
- Recherche : fondamentale, translationnelle, clinique
- Enseignement : universitaire et post-universitaire.
Avec 197 lits et places et 843 salariés, le Centre Antoine Lacassagne prend en charge tous les types de cancer et traite une file active de plus de 6000 patients par an. Institut de référence en cancérologie, il a pour ambition de faire bénéficier à tous les patients des innovations qui vont révolutionner la médecine de demain : médecine personnalisée, immunothérapie, protonthérapie…, tout en garantissant un haut niveau de qualité de prise en charge.
http://www.centreantoinelacassagne.org/
Nice
Diplôme d'ingénieur Date engineer/data/informatique ou équivalent (Bac+5 minimum)
Débutant (moins de 2 ans), Expérimenté (2 à 5 ans), Confirmé (5 ans et plus)
CDI
Ingénieur en biologie médicale
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.