Présentation
La notion d’Action d’animation est au centre de MaDICS. Elle recouvre une problématique de recherche partagée par une communauté de chercheurs et de partenaires de diverses disciplines sur des masses de données scientifiques bien identifiées. Une Action propose un projet d’animation de recherche interdisciplinaire coordonnant diverses activités (journées thématiques ou scientifiques, écoles d’été, études prospectives, proposition ou comparaison de méthodes et d’algorithmes, challenges scientifiques, etc. ).
Une Action et ses activités doivent respecter divers critères, tout particulièrement une visibilité scientifique à travers par exemple la production de rapports prospectifs ou l’organisation de séminaires ; une animation nationale voire internationale et surtout une forte dimension interdisciplinaire. Les activités peuvent être développées en collaboration avec d’autres instances tels que des grands instruments, centres de calcul, autres organismes, autres GDR, …
Une création d’Action se fait suite à des appels émis par le GDR MaDICS. Il n’est pas prévu de création au fil de l’eau. Pour consulter l’Appel en cours, rendez-vous sur MaDICS rubrique Actions/Appel.
Afin de favoriser les rencontres et l’interdisciplinarité, de renforcer les collaborations et d’éviter l’éparpillement des forces (et des moyens financiers), une Action est créée pour une durée de vie limitée (2ans, renouvelable une fois) et le nombre d’Actions soutenue en parallèle sera limité. Notez que chaque Action a au moins deux responsables issus d’instituts différents.
Chaque Action devra fournir un rapport d’activité annuel (attendu mi-octobre).
Actions en cours
Big Data for Astronomy (2020-2024)
Acronyme : BigData4Astro
Responsables :
- André SCHAAFF, CDS, INSU
- Karine ZEITOUNI, DAVID, INS2i
- Nicolas Lumineau, LIRIS, INS2i
Résumé :
En astronomie, comme dans d’autres domaines, les recherches s’appuient en partie sur des analyses fines de grandes masses de données et des simulations à très grande échelle présentant des exigences spécifiques. En astronomie, la réponse à certaines questions, nécessite un saut d’un ordre de grandeur dans la taille, e.g. des simulations numériques. Les environnements informatiques actuels s’appuient sur des architectures HPC confrontées à des difficultés de gestion des données massives. Notre objectif est d’organiser et de mettre en réseau une communauté de chercheurs et d’ingénieurs s’intéressant à ces problématiques, favorable à une synergie interdisciplinaire scientifique et technique, s’inscrivant dans les efforts de convergence entre HPC et Big Data pour le traitement de ce type de données.
Données Intelligentes: transformer l’information en connaissance (2020-2024)
Acronyme : DOING
Responsables :
- Mirian HALFELD FERRARI ALVES, LIFO, INS2i
- Anne-Lyse MINARD-FORST, LLL, INSHS
- Genoveva VARGAS-SOLAR, LIRIS, INS2i
Résumé :
L’action DOING se concentre sur la transformation des données en information puis en connaissance. L’idée est de mettre à contribution les expertises des chercheurs en TAL, BD et IA pour :
(1) extraire des informations dans les données textuelles et les représenter pour peupler des bases de connaissances. Le choix des entités et des relations à extraire pourra être guidé par les requêtes et éventuellement la structure de la base, avec l’idée d’extraire et stocker les données les plus intéressantes et importantes pour les consultations et les analyses des experts. DOING s’intéresse en particulier à la question de l’extraction de relations (pas uniquement binaire et pas uniquement inter-phrase) et à ce que l’interaction avec les bases peut apporter à cette tâche;
(2) proposer des méthodes intelligentes pour la manipulation et la maintenance de ces bases avec de nouvelles formes de requêtes englobant des mécanismes d’analyse efficaces, flexibles, sûrs, adaptés à l’utilisateur et qui respectent des contraintes de qualité et de vie privée. DOING s’intéresse en particulier aux graphes de propriétés, au langage d’interrogation style Cypher dans le cadre de Open Cypher et GQL et aux algorithmes d’analyse des graphes (centrality, community detection, similarity, link prediction, pathfinding).
Data Science in Chemistry (2022-2024)
Acronyme : DSChem
Responsables :
- Dominique Douguet, IPMC, INSB
- Nicolas Blanchard, LIMA, INC
- Bertrand Cuissart, GREYC, INS2i
Résumé :
En complément des moyens existants, DSChem vise à organiser un groupe de travail ouvert à tous et dont les échanges permettront d’identifier rapidement les besoins informatiques en traitement d’information chimique et les compétences à mobiliser pour y répondre.
Ainsi, à court terme, DSChem favorisera l’identification d’une communauté de chercheurs autour de ce thème.
A moyen terme, DSChem favorisera la création et la conduite de projets dans ce périmètre, stimulant ainsi la qualité de la production scientifique associée.
Human Explainable machine Learning Pipeline (2021-2025)
Acronyme : HELP
Responsables :
- Michael Baker, i3, INSHSi
- Nicolas Labroche, LIFAT, INS2i
- Julien Aligon, IRIT, INS2i
Résumé :
Modélisation multi-échelle de masses de données musicales (2022-2025)
Acronyme : Musiscale
Responsables :
- Florence Levé, MIS, UPJV, CRISTAL INS2i
- Sylvain Marchand, L3i, Univ. de La Rochelle
- Jean-Marc Chouvel, IReMus, INSHS
Résumé :
Le but de cet atelier est d’amorcer une réflexion collective sur des paradigmes de représentation et de traitement des données musicales visant à rendre compte de la structure de leur organisation à différentes échelles. On privilégiera les approches se rattachant à la théorie de l’information, pouvant s’appliquer aux données musicales. On espère ainsi pouvoir faire mieux converger les visions informatiques, musicologiques, cognitives et applicatives dans la façon d’appréhender ces données.
Simplification et Vulgarisation des Textes Scientifiques (2021-2024)
Acronyme : SimpleText
Responsables :
- Liana Ermakova, HCTI, Univ. Bretagne Occidentale
- Olivier Augereau, Lab-STICC, INS2i
- Eric Sanjuan, LIA, INS2i
Résumé :
Les systèmes modernes d’accès à l’information promettent de donner aux citoyens un accès direct à des informations clés provenant de sources primaires faisant autorité. La littérature scientifique est concernée mais est en réalité difficilement accessible aux non-experts en raison de la complexité langagière, la structure, longueur, etc des documents scientifiques et de leur manque d’acculturation scientifique. La teneur du débat scientifique qui procède par confrontation d’une multiplicité d’études avant de parvenir à un consensus est aussi source de complexité. Les décisions individuelles ou politiques sont potentiellement impactées par une méconnaissance de l’ensemble des travaux et débats scientifiques.
Cette difficulté de lecture de document scientifique existe également lorsque les scientifiques s’intéressent aux documents scientifiques des autres disciplines que celles dont ils sont experts. Les résultats contradictoires à l’intérieur même d’une discipline sont difficilement appréhendables par des non-spécialistes. Quid alors des résultats contradictoires entre disciplines?
La simplification de textes se donne pour objectif de réduire ces obstacles.
L’atelier SimpleText abordera les opportunités et les défis des approches de simplification de textes scientifiques pour améliorer l’accès à l’information scientifique et l’acculturation scientifique.
L’atelier SimpleText s’appuiera sur une communauté interdisciplinaire de chercheurs en TALN, en RI, de linguistes, de sociologues, de journalistes scientifiques et de vulgarisateurs scientifiques travaillant ensemble pour tenter de résoudre l’un des plus grands défis d’aujourd’hui.