Informations générales
Intitulé de l'offre : Assistant-e Ingénieur-e traitement de données et enquêtes H/F
Référence : UMR7107-ANIFOR-017
Nombre de Postes : 1
Lieu de travail : VILLEJUIF
Date de publication : mardi 18 mars 2025
Type de contrat : IT en contrat CDD
Durée du contrat : 5 mois
Date d'embauche prévue : 1 mai 2025
Quotité de travail : Complet
Rémunération : à partir de 2325€ bruts mensuels
Niveau d'études souhaité : BAC + 2
Expérience souhaitée : Indifférent
BAP : D - Sciences Humaines et Sociales
Emploi type : Assistant-e ingénieur-e en production, traitement de données et enquêtes
Missions
Contribuer à la conception et la mise en œuvre de protocoles de collecte, de publication électronique et de traitement de corpus de langues rares. Participer à la préparation des corpus audio/vidéo annotés pour publication électronique (archivage), en étroite collaboration avec les chercheurs (Sciences du langage et Anthropologie linguistique) et les collègues IT (ingénieure informaticienne et technicien).
Activités
- Participer à la conception et à l’organisation de corpus multimédia de langues rares dans une archive ouverte, la collection « Pangloss » (.
- Contribuer à la valorisation et à la diffusion des résultats, en particulier via le site
.
- Assurer les opérations de codage et de recodage de métadonnées.
- Contribuer à la qualité et à la cohérence des corpus par un suivi des projets, de la collecte à la publication électronique des données.
- Former et conseiller les chercheurs en matière d’outils d’annotation et de traitement.
- Aider à paramétrer les outils selon les particularités des projets et situations d’enquête.
- Exercer une veille sur les méthodes d’enquêtes et les outils de traitement de données.
Compétences
Savoirs :
- Méthodes et outils en traitement et analyse des données, en particulier celles des enquêtes linguistiques de terrain (Maîtrise).
- Méthodes et outils en production de données (connaissance générale)
- Principes de gestion des métadonnées : préconisations du réseau OLAC d’archives
ouvertes, outils spécialisés
- Systèmes de gestion de base de données (connaissance générale)
- Familiarité avec les technologies web : connaissance générale XML, XSLT
- Archivage pérenne des données de recherche (notions)
- Connaissances générales en linguistique souhaitables. Un rudiment en ethnologie/anthropologie serait un plus.
- Cadre légal et déontologique (connaissance générale)
- Techniques de présentation écrite et orale
- Langue anglaise : B1 (cadre européen commun de référence pour les langues)
- Une familiarité préalable avec les outils logiciels les plus couramment employés en
linguistique de terrain serait un plus (Elan, Toolbox,
- Savoir assurer la traçabilité des procédures de traitement des informations.
- Savoir mobiliser les bases de données relatives au champ de recherche.
- Savoir transférer les données d’un logiciel à un autre (notamment en paramétrant des
scripts Python).
- Savoir participer à la rédaction des textes de présentation des divers corpus sur
, en français (et si possible également en anglais)
Savoirs-être :
- Travailler en équipe avec des chercheurs, des spécialistes d’informatique, d’audiovisuel, d’Information Scientifique et Technique
- Savoir s’adapter d’une façon qui encourage la créativité
Contexte de travail
La mission du LACITO (Langues et Civilisations à Tradition Orale, UMR 7107 CNRS / Sorbonne Nouvelle / INALCO) est de décrire et étudier la diversité des langues et des civilisations à tradition orale. Cette mission comporte un caractère d’urgence, du fait de l’érosion de cette diversité, parallèle à l’érosion des écosystèmes et la chute de la biodiversité. La collection Pangloss, archive ouverte principalement dédiée aux langues à tradition orale, regroupe des corpus dans près de 200 langues. Cette collection, en libre accès pour tous les publics (, est au cœur d’un environnement de Science ouverte, l’enjeu étant de parvenir à un progrès cumulatif des connaissances, grâce à un appui mutuel entre données, outils et publications.
Le LACITO est un laboratoire « à taille humaine », à la gouvernance collégiale : un
laboratoire à l’écoute des langues, à l’écoute des gens. Au sein du laboratoire, la personne recrutée travaillera en équipe avec une ingénieure (qui assure dépôt des données en archive pérenne, maintenance d’éléments d’applications informatiques, et nouvelles innovations) et un technicien. Le travail autour des corpus oraux bénéficie de relations de confiance et d’étroite collaboration avec des partenaires d’autres institutions dont l’Infrastructure de Recherche* Huma-Num, la Bibliothèque nationale de France et le Laboratoire Ligérien de Linguistique (voir à titre d’exemple : https:///actualite/datathon/)
Contraintes et risques
Du fait du rôle central des interactions avec les collègues, la présence sur site revêt une
importance évidente. Le poste est néanmoins compatible sans difficulté particulière avec le télétravail partiel selon les règlements et préconisations du CNRS.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.