Thèse CIFRE: Traitement et visualisation de données textuelles au service de l’analyse qualitative des échanges sur les médias sociaux

When:
30/10/2016 – 31/10/2016 all-day
2016-10-30T02:00:00+01:00
2016-10-31T01:00:00+01:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : AtNetPlanet et UTT-Institut Charles Delaunay (UMR, CNRS)
Durée : 3
Contact : aurelien.benel@utt.fr
Date limite de publication : 2016-10-30

Contexte :
Sujet de thèse de doctorat en entreprise

Titre : Traitement et visualisation de données textuelles au service de l’analyse qualitative des échanges sur les médias sociaux.

Discipline : Informatique.

Direction scientifique : Aurélien Bénel, maître de conférences en informatique, sera directeur de thèse pour la cinquième fois (dont quatre fois pour des thèses en entreprise). Il est par ailleurs co-responsable du cours de méthodologie de la formation doctorale.

Financement : CIFRE.

Sujet :
Enjeux scientifiques

Le traitement des données textuelles issues des médias sociaux, très à la mode actuellement, bute sur un paradoxe bien connu de la lexicométrie : alors qu’invariablement on montre l’efficacité des algorithmes en leur faisant retrouver ce que l’on sait déjà, on voudrait “apprendre du neuf”, détecter des “signaux faibles”.

À l’inverse, l’analyse qualitative, dans son refus radical de “compter” et de “classer” (Lejeune, 2014), est particulièrement efficace pour distinguer des singularités, des exceptions, des “possibles” jusque là négligés. Mais, hélas, ses méthodes minutieuses sont difficilement applicables à des corpus volumineux.

Par le passé, nous avons inauguré des pistes pour réconcilier les deux approches (Lejeune et Bénel, 2012), non dans un syncrétisme méthodologique suspect, mais en essayant de s’inscrire dans les théories de la sémiotique (Bénel et al., 2010) et dans la tradition de l’herméneutique (Bénel, 2014). Le but de la thèse à venir est d’explorer jusqu’où ces pistes peuvent être empruntées lorsque l’archive dans laquelle l’analyste peut piocher est à l’échelle du Web social. Une attention toute particulière sera portée aux techniques de visualisation de données, en tant que point de croisement entre les capacités de calcul de l’ordinateur et les capacités de perception pré-attentive puis d’interprétation des usagers.

Profil recherché

Le candidat (la candidate), titulaire d’un Bac+5 en informatique et ayant été initié à la Recherche, devra apporter la preuve :

de ses compétences en visualisation de données, tant sur le plan technique que créatif,
de ses compétences rédactionnelles et argumentatives (en français ou en anglais).
Par ailleurs, il (elle) devra présenter une certaine appétence :

pour le prototypage rapide (notamment de services REST),
pour l’analyse fine de textes (en français),
pour l’apprentissage et la mise en œuvre de théories issues d’autres champs scientifiques.

Bibliographie

Aurélien Bénel (2014). Quelle interdisciplinarité pour les « humanités numériques » ?. Cahiers du numérique *10(4)***, 103–132. Hermès-Lavoisier.
Aurélien Bénel, Christophe Lejeune, Chao Zhou (2010). Éloge de l’hétérogénéité des structures d’analyse de textes. Document numérique, RSTI *13(2)***, 41–56. Hermès-Lavoisier.
Christophe Lejeune (2014). Manuel d’analyse qualitative : Analyser sans compter ni classer. De Boeck.
Christophe Lejeune, Aurélien Bénel (2012). Lexicométrie pour l’analyse qualitative : Pourquoi et comment résoudre le paradoxe. Actes des 11e journées internationales d’analyse statistique de données textuelles (JADT), Lexicometrica.

Profil du candidat :
Profil recherché

Le candidat (la candidate), titulaire d’un Bac+5 en informatique et ayant été initié à la Recherche.

Formation et compétences requises :
Profil recherché

Le candidat (la candidate) devra apporter la preuve :

– de ses compétences en visualisation de données, tant sur le plan technique que créatif,
– de ses compétences rédactionnelles et argumentatives (en français ou en anglais).
Par ailleurs, il (elle) devra présenter une certaine appétence :

– pour le prototypage rapide (notamment de services REST),
– pour l’analyse fine de textes (en français),
– pour l’apprentissage et la mise en œuvre de théories issues d’autres champs scientifiques.

Adresse d’emploi :
Contact Laboratoire: http://techcico.utt.fr/fr/_plugins/mypage/mypage/content/benel.html

Double-rattachement (CIFRE):

AtNetPlanet est une agence de communication digitale, implantée à Ivry-sur-Seine et spécialisée dans le secteur de l’agro-alimentaire. Au-delà des prestations habituelles en informatique (réalisation de sites de e-Commerce, d’applications mobiles, référencement naturel) ou en marketing (sites vitrines, référencement payant, viralité, gestion de communauté), l’agence investit largement dans la Recherche & Développement autour de toutes les technologies qui permettraient de quantifier ou d’optimiser le retour sur investissement de ses clients. C’est dans cet esprit que l’entreprise s’est dotée d’une cellule dédiée à l’e-Réputation. Au sein de cette équipe, le doctorant (la doctorante) aura accès à trois des meilleurs logiciels du marché de suivi des médias sociaux, à l’expérience de ses membres, aux cas des clients. C’est également cette équipe qui se chargera de l’industrialisation des solutions prototypées par le doctorant (la doctorante).

Tech-CICO est une équipe de recherche de l’Institut Charles Delaunay (Unité mixte de recherche, CNRS) à l’Université de technologie de Troyes. Construite autour d’un objet interdisciplinaire – les technologies pour les collectifs – cette équipe regroupe des chercheurs en informatique, psychologie, linguistique et sociologie. En sus de cet environnement interdisciplinaire stimulant, le doctorant (la doctorante) sera invité(e) à participer au réseau Hypertopic, co-animé par son directeur de thèse, et portant sur l’assistance logicielle à la construction du sens. Il (elle) aura par ailleurs accès aux services logiciels et aux terrains de la plateforme du même nom.

Document attaché :