Déploiement et évaluation d’un annotateur immersif et embarqué, application à la reconnaissance d’entité

When:
31/01/2025 all-day
2025-01-31T01:00:00+01:00
2025-01-31T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : MaIAGE, INRAE, université Paris-Saclay
Durée : 6 mois
Contact : arnaud.ferre@inrae.fr
Date limite de publication : 2025-01-31

Contexte :
Les techniques d’extraction d’information (text-mining) récentes les plus performantes reposent sur de l’apprentissage automatique supervisé. Or, l’évaluation et l’entraînement de ces méthodes nécessitent une phase d’annotation humaine laborieuse. Cela est particulièrement vrai pour les domaines spécialisés, tels que la microbiologie, où la production et la validation des annotations nécessitent l’intervention d’experts, et où les données produites sont d’un grand intérêt [Deléger2016]. La Réalité Virtuelle (RV) et par extension la Réalité Étendue (XR) permettent d’améliorer les performances d’utilisateurs ainsi que leur engagement lors de la réalisation de tâches spécifiques comme de la rééducation ou de l’apprentissage humain [David2017, Mayer2023].

Sujet :
Projet :
Nous proposons dans ce stage de développer et d’évaluer un outil d’annotation textuelle immersif en Réalité Virtuelle (RV) similaire à VAnnotator [Spiekermann2018] pouvant tirer parti des possibilités d’annotation en Réalité Étendue (XR) [Borhani2023]. La tâche d’annotation spécifique visée sera la reconnaissance d’entités. Cette dernière consiste à identifier et classifier des entités nommées dans un texte (ex : identifier dans la phrase suivante que la mention “Escherichia coli” est une bactérie – “Escherichia coli est trouvée dans les intestins des animaux”). L’accent sera mis sur la mise en place de l’annotateur immersif ainsi que de son évaluation comparée avec les outils existants.

Objectifs du stage :
– Revue de la littérature des solutions d’annotation immersives.
– Transfert de données textuelles issues d’un corpus BB4 pour la reconnaissance d’entités et développé à MaIAGE dans un casque de RV.
– Installation et configuration d’un annotateur standard [Colucci2024] dans un environnement immersif, pour la visualisation des données, le développement de fonctionnalités et pour améliorer l’annotation en RV.
– Mise en place d’expérimentations utilisateurs pour comparer l’utilisation immersive et non-immersive de Doccano (cybersickness, utilisabilité, etc.).
– Rédaction du manuscrit pour diffusion et documentation.

Le stage pourra être l’occasion de préparer un poster pour une conférence des domaines concernés (ex : IHM, TALN).

Profil du candidat :
Étudiant en Master 2, élève-ingénieur des Grandes Écoles ou équivalent.

Formation et compétences requises :
Formations visées : informatique (IHM, IA, etc.) ou équivalent.

Compétences requises :
– Compétences en développement informatique (préférentiellement web, Python et Android)
– Compétences en IHM (évaluation de l’expérience utilisateur, analyse d’applications interactives)
– Une expérience en développement XR serait un plus
– Capacité de travail en autonomie
– Un attrait pour la recherche scientifique

Adresse d’emploi :
INRAE – Unité MaIAGE Bât 210 et 233 Domaine de Vilvert 78352 JOUY-EN-JOSAS

Document attaché : 202411201454_Offre de stage M2 IHM & Text-Mining.pdf