Actions

Présentation

La notion d’Action d’animation est au centre de MaDICS. Elle recouvre une problématique de recherche partagée par une communauté de chercheurs et de partenaires de diverses disciplines sur des masses de données scientifiques bien identifiées. Une Action propose un projet d’animation de recherche interdisciplinaire coordonnant diverses activités  (journées thématiques ou scientifiques, écoles d’été, études prospectives, proposition ou comparaison de méthodes et d’algorithmes, challenges scientifiques, etc. ).

Une Action et ses activités doivent respecter divers critères, tout particulièrement une visibilité scientifique à travers par exemple la production de rapports prospectifs ou l’organisation de séminaires  ; une animation nationale voire internationale et surtout une forte dimension interdisciplinaire. Les activités peuvent être développées en collaboration avec d’autres instances tels que des grands instruments, centres de calcul, autres organismes, autres GDR, …

Une création d’Action se fait suite à des appels émis par le GDR  MaDICS. Il n’est pas prévu de création au fil de l’eau. Pour consulter l’Appel en cours, rendez-vous sur MaDICS rubrique Actions/Appel.

Afin de favoriser les rencontres et l’interdisciplinarité, de renforcer les collaborations et d’éviter l’éparpillement des forces (et des moyens financiers), une Action est créée pour une durée de vie limitée (2ans, renouvelable une fois) et le nombre d’Actions soutenue en parallèle sera limité. Notez que chaque Action a au moins deux responsables issus d’instituts différents.

Chaque Action devra fournir un rapport d’activité annuel (attendu mi-octobre).

Actions en cours

Big Data for Astronomy (2020-2024)

Acronyme : BigData4Astro

Responsables :

Résumé :

En astronomie, comme dans d’autres domaines, les recherches s’appuient en partie sur des analyses fines de grandes masses de données et des simulations à très grande échelle présentant des exigences spécifiques. En astronomie, la réponse à certaines questions, nécessite un saut d’un ordre de grandeur dans la taille, e.g. des simulations numériques. Les environnements informatiques actuels s’appuient sur des architectures HPC confrontées à des difficultés de gestion des données massives. Notre objectif est d’organiser et de mettre en réseau une communauté de chercheurs et d’ingénieurs s’intéressant à ces problématiques, favorable à une synergie interdisciplinaire scientifique et technique, s’inscrivant dans les efforts de convergence entre HPC et Big Data pour le traitement de ce type de données.

Données Intelligentes: transformer l’information en connaissance (2020-2024)

Acronyme : DOING

Responsables :

Résumé :

L’action DOING se concentre sur la transformation des données en information puis en connaissance. L’idée est de mettre à contribution les expertises des chercheurs en TAL, BD et IA pour :
(1) extraire des informations dans les données textuelles et les représenter pour peupler des bases de connaissances. Le choix des entités et des relations à extraire pourra être guidé par les requêtes et éventuellement la structure de la base, avec l’idée d’extraire et stocker les données les plus intéressantes et importantes pour les consultations et les analyses des experts. DOING s’intéresse en particulier à la question de l’extraction de relations (pas uniquement binaire et pas uniquement inter-phrase) et à ce que l’interaction avec les bases peut apporter à cette tâche;
(2) proposer des méthodes intelligentes pour la manipulation et la maintenance de ces bases avec de nouvelles formes de requêtes englobant des mécanismes d’analyse efficaces, flexibles, sûrs, adaptés à l’utilisateur et qui respectent des contraintes de qualité et de vie privée. DOING s’intéresse en particulier aux graphes de propriétés, au langage d’interrogation style Cypher dans le cadre de Open Cypher et GQL et aux algorithmes d’analyse des graphes (centrality, community detection, similarity, link prediction, pathfinding).

Data Science in Chemistry (2022-2024)

Acronyme : DSChem

Responsables :

Résumé :

DSChem a pour objectif de renforcer l’interface entre la chimie et l’informatique, au niveau national.

En complément des moyens existants, DSChem vise à organiser un groupe de travail ouvert à tous et dont les échanges permettront d’identifier rapidement les besoins informatiques en traitement d’information chimique et les compétences à mobiliser pour y répondre.

Ainsi, à court terme, DSChem favorisera l’identification d’une communauté de chercheurs autour de ce thème.

A moyen terme, DSChem favorisera la création et la conduite de projets dans ce périmètre, stimulant ainsi la qualité de la production scientifique associée.

Human Explainable machine Learning Pipeline (2021-2025)

Acronyme : HELP

Responsables :

Résumé :

L’action vise à faire se rencontrer des chercheurs en informatique, spécialistes de la fouille de données et de manipulation de données, argumentation et traçabilité (INS2I) et des chercheurs en sciences humaines et sociales, spécialistes du discours explicatif et des mécanismes cognitifs en prise avec l’élaboration d’explications (INSHS) [Miller, 2019], en interaction avec des spécialistes industriels ayant des problématiques d’explication liée à l’exploitation automatique de leurs données à travers des pipelines de bout-en-bout allant des données brutes aux résultats d’analyse finaux. L’objectif de ces rencontres est : (i) De mieux comprendre les mécanismes sousjacents à une explication et à sa réception et de produire une typologie des problèmes d’explications en fonction des scénarios d’usage en informatique : en fonction des données et des prétraitements de données effectués dessus, de l’utilisateur et de la nature de la méthodes qui traite les données (clustering, classification,recommandation) ; (ii) De produire des algorithmes interactifs, suivant le principe UXAI (User Centric eXplainable AI), permettant d’accompagner un utilisateur dans la co-construction d’une explication portant principalement sur les phases de prétraitement de données ; (iii) De définir des méthodes d’évaluation de la qualité d’une explication, en lien avec les utilisateur mais aussi les données sur lesquelles reposent le processus d’analyse.

Modélisation multi-échelle de masses de données musicales (2022-2025)

Acronyme : Musiscale

Responsables :

Résumé :

La masse de données musicales disponibles de nos jours représentent une richesse considérable d’un point de vue culturel et créatif, ainsi qu’en terme de capacité de valorisation éducative et industrielle.

Le but de cet atelier est d’amorcer une réflexion collective sur des paradigmes de représentation et de traitement des données musicales visant à rendre compte de la structure de leur organisation à différentes échelles. On privilégiera les approches se rattachant à la théorie de l’information, pouvant s’appliquer aux données musicales. On espère ainsi pouvoir faire mieux converger les visions informatiques, musicologiques, cognitives et applicatives dans la façon d’appréhender ces données.

Simplification et Vulgarisation des Textes Scientifiques (2021-2024)

Acronyme : SimpleText

Responsables :

Résumé :

Les systèmes modernes d’accès à l’information promettent de donner aux citoyens un accès direct à des informations clés provenant de sources primaires faisant autorité. La littérature scientifique est concernée mais est en réalité difficilement accessible aux non-experts en raison de la complexité langagière, la structure, longueur, etc des documents scientifiques et de leur manque d’acculturation scientifique. La teneur du débat scientifique qui procède par confrontation d’une multiplicité d’études avant de parvenir à un consensus est aussi source de complexité. Les décisions individuelles ou politiques sont potentiellement impactées par une méconnaissance de l’ensemble des travaux et débats scientifiques.
Cette difficulté de lecture de document scientifique existe également lorsque les scientifiques s’intéressent aux documents scientifiques des autres disciplines que celles dont ils sont experts. Les résultats contradictoires à l’intérieur même d’une discipline sont difficilement appréhendables par des non-spécialistes. Quid alors des résultats contradictoires entre disciplines?
La simplification de textes se donne pour objectif de réduire ces obstacles.
L’atelier SimpleText abordera les opportunités et les défis des approches de simplification de textes scientifiques pour améliorer l’accès à l’information scientifique et l’acculturation scientifique.
L’atelier SimpleText s’appuiera sur une communauté interdisciplinaire de chercheurs en TALN, en RI, de linguistes, de sociologues, de journalistes scientifiques et de vulgarisateurs scientifiques travaillant ensemble pour tenter de résoudre l’un des plus grands défis d’aujourd’hui.