Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : GREYC CNRS UMR 6072 (Université de Caen Normandie) en collaboration avec l’IRISA CNRS UMR 6074 et le LIPN CNRS UMR 7030
Durée : 1 an (extensible)
Contact : bruno.cremilleux@unicaen.fr
Date limite de publication : 2017-11-01
Contexte :
Dans les entreprises, les réunions sont connues pour être consommatrices de temps. Selon une étude menée par Microsoft, les employés passeraient en moyenne 5,6h par semaine en réunion. Le projet REUs vise à concevoir un logiciel d’aide à la préparation et au suivi de réunions de type suivi de projets. Il se basera uniquement sur les flux sonores des interactions entre les participants aux réunions et sur des ressources linguistiques.
Sujet :
Le ou la postdoctorant(e) travaillera sur l’extraction d’information à partir de données textuelles. La démarche est, à partir des transcriptions textuelles des discussions, de trouver des relations entre tâches, participants, objectifs, etc., discutées pendant la réunion, afin de générer un rapport.
Plus précisément, à partir de transcriptions textuelles des discussions formant des corpus d’apprentissage, il s’agit d’apprendre comment détecter les événements et les relier entre eux au sein d’une phrase ainsi qu’à capter des relations dont la portée dépasse la phrase, comme associer une information à un contexte cité précédemment ou relevant de l’analyse de la prise de parole. Pour cela, nous nous appuierons sur les méthodes de fouille de données textuelles développées notamment au sein du consortium et qui extraient des motifs séquentiels formant de potentiels patrons linguistiques. Ces méthodes nécessiteront de nouveaux développements pour intégrer des spécificités du corpus comme le fait que celui-ci est organisé sous forme de dialogue et aussi d’intégrer le contexte dans lequel se situe un motif, ce dernier point est à ce jour très peu développé en fouille de données.
Le ou la postdoctorant(e) devra donc collaborer avec les autres membres
du projet REUs pour le développement d’approches adaptées s’appuyant
sur la fouille de motifs et le traitement des langues pour extraire
ces relations.
Les aspects en lien avec la transcription textuelle seront traités
par un autre partenaires du projet.
Profil du candidat :
Le ou la candidat(e) devra avoir obtenu une thèse en informatique et une expérience en fouille de données, ou apprentissage, et/ou en traitement de la langue.
Formation et compétences requises :
Des compétences en programmation sont nécessaires.
Adresse d’emploi :
Le dossier de candidature comportera :
– une lettre de motivation
– un CV détaillé
– lettres de recommandation ou, à défaut, les noms de personnes
qui recommandent la candidature,
– tout document jugé utile.
Les documents sont à envoyer en *pdf exclusivement* :
Peggy Cellier : peggy.cellier@irisa.fr
Thierry Charnois : Thierry.Charnois@lipn.univ-paris13.fr
Bruno Crémilleux : bruno.cremilleux@unicaen.fr
Albrecht Zimmermann albrecht.zimmermann@unicaen.fr