Action MADONA (2018-2022)
Maîtriser l’Analyse interactive de DOnnées pour la NArration journalistique
Responsables
- Patrick Marcel, LIFAT EA 6300, INS2i
- Marie Chagnoux, CEMTI, INSHS
Thématiques
Exploration interactive de données, élaboration de recommandations, apprentissage automatique, analyse du discours et des pratiques journalistiques, journalisme automatisé, nouvelles narrations
Données concernées
données ouvertes, articles de presse
Mots clés
data journalisme, data science, analyse interactive de données, narration journalistique
Contexte et positionnement scientifique
L’action MADONA s’inscrit dans la continuité d’un atelier MADICS (Atelier Cajole, CORIA/TALN 2018) qui avait fait émerger la nécessité de documenter et de modéliser les processus d’analyse des datajournalistes. Lors des deux premières années de MADONA, nous nous sommes donc attachés à mener de front ces deux thématiques. D’une part, nous avons commencé à documenter le travail des datajournalistes par une approche qualitative (questionnaire de description des pratiques et observation de terrain en contexte d’apprentissage). D’autre part, nous avons élaboré une modélisation (i) des intentions d’analyse des « data analysts », et (ii) des mécanismes qui construisent une narration à partir des données. Nous avons ainsi pu proposer différents modèles et outils préliminaires pour aider l’analyste à organiser son travail.
Cette étude, toujours en cours, nous a permis d’identifier deux verrous scientifiques que nous nous proposons d’aborder lors des deux prochaines années de l’action MADONA :
- quelle méthodologie pour la construction de narrations ? Existe-t-il des motifs méthodologiques, des scénarios privilégiés pour la construction de narrations ? Cette problématique convoquera à la fois analyse des pratiques et analyse des productions pour une double approche.
- quel est l’impact de la visée narrative sur les outils (méthodes, type d’algorithme,…)? Quelles sont les stratégies mises en oeuvre pour choisir au mieux les outils pertinents pour une narration ?
L’objectif à long terme demeure identique : la construction d’un système interactif complet reposant sur les modèles décrits plus haut et des méthodes de visualisation interactives pour accompagner la mise en narration de données.
Le renouvellement de l’action sera l’occasion de capitaliser sur les résultats des deux premières années, afin d’aborder de manière détaillée les aspects méthodologiques de la narration à partir de données. Nous attacherons une importance particulière aux aspects formels (forme discursive, schéma narratif) et sémantiques (intentions, argumentation) de la narration.
Par ce positionnement, l’action MADONA complète les actions MADICS Lemon (qui étudie les liens entre exploration de données et messages) et Platform (qui étudie l’impact d’algorithmes sur des décisions), tout en gardant son caractère original autour de l’étude de construction d’un type particulier de narration.
Enfin, nous souhaitons ici nous positionner par rapport à deux thématiques qui nous sont souvent soumises et présupposent la nécessité d’un apport en TAL: celle des fake news et du journalisme automatisé. L’objectif de MADONA n’est pas d’automatiser la vérification de données ou la rédaction d’articles mais bien de documenter et accompagner l’exploration et la mise en narration manuelle du journaliste, ou plus généralement d’un analyste devant produire une narration.