Le GDR MaDICS possède des Ateliers, outils de préfiguration des futures Actions.
En 2025, quatre Ateliers sont présents :
Data & Astro
Acronyme : DatAstro
Responsables :
- André SCHAAFF, CDS, INSU
- Nicolas LUMINEAU, LIRIS, INS2i
Résumé :
En astronomie, comme dans d’autres domaines, les recherches s’appuient en partie sur des analyses fines de grandes masses de données et des simulations à très grande échelle présentant des exigences spécifiques. En astronomie, le changement d’échelle (en termes de données) est également permanent et suit la mise en production des nouveaux instruments toujours plus performants et précis dans leurs mesures. Les environnements informatiques actuels s’appuient sur des architectures HPC confrontées à des difficultés de gestion des données massives. Notre objectif est de renforcer et de mettre en réseau une communauté de chercheurs et d’ingénieurs s’intéressant à ces problématiques.
Explicabilité des Modèles multi-modaux d’Intelligence Artificielle pour intensifier la découverte scientifique
Acronyme : EXMIA
Responsables :
- Céline ROBARDET, LIRIS, INS2i
- Sebastien FIORUCCI, ICN,INC
Résumé :
L’Atelier EXMIA est un lieu de discussions et d’échanges autour des questions de découvertes scientifiques à partir de modèles de machine learning et de leurs explications. Il rassemble des chercheurs en informatique, chimie, biologie, médecine et neurosciences autour de la modélisation des phénomènes intracellulaires complexes par apprentissage automatique à l’aide de modèle multi-modaux capables de traiter des informations biologiques riches. Ces modèles reposent sur des architectures avancées, telles que les modèles de langage multimodal (LMM) et les réseaux de neurones sur graphes (GNN), qui permettent de relier des données hétérogènes. L’un des défis clés est l’explicabilité de ces modèles, indispensable pour formuler des hypothèses sur les mécanismes sous-jacents des phénomènes étudiés.
Geoscience Knowledge and Interpretation Formalisation
Acronyme : EXMIA
Responsables :
- Gautier LAURENT, ISTO, INSU
- Christelle LOISELET, Direction Numérique des Géosciences, BRGM
- Patrick MARCEL, LIFO, INS2i
ICN,INC
Résumé :
L’Atelier GeoKIF : Geoscience Knowledge and Interpretation Formalisation, vise à faire progresser la recherche en géosciences en facilitant l’échange de connaissances et le développement de nouvelles méthodes numériques pour gérer, analyser et interpréter les données géoscientifiques. L’interdisciplinarité dans le domaine des géosciences est cruciale pour prendre en compte les avancées technologiques qui offrent aujourd’hui de nouvelles perspectives pour une meilleure compréhension de la dynamique du sous sol de notre planète et une gestion plus durable des ressources qu’il contient. L’atelier permettra ainsi de favoriser les échanges entre géologues et informaticiens pour créer une communauté mixte pour répondre à ces enjeux.
Geoscience Similarités de données massives et complexes – Des défis sémantiques à l’optimisation pour le calcul haute performance
Acronyme : EXMIA
Responsables :
- Sophie ROBERT, LIFO, INS2i
- Lucile MOLLET, CBM, INSB
- Christel DARTIGUES-PALLEZ, I3S, INS2i
Résumé :
De nombreux domaines nécessitent l’analyse de grands volumes de données de complexités variées, comme par exemple, des données séquentielles avec différentes granularité, périodicité, complétude, etc., notamment pour évaluer leur similarité. Le choix de la mesure de similarité doit prendre en compte des aspects sémantiques et des aspects calculatoires. Ces deux dimensions sont généralement en tension et un des enjeux du choix est dans le fait de trouver des compromis acceptables. Les solutions informatiques pour arriver à un compromis sont multiples et passent notamment par des approches algorithmiques qui vont bien approximer des métriques ou en rendre leur calcul efficace sur de grands volumes de données. SIMDAC se présente comme un atelier dédié à l’étude des similarités dans les données massives et complexes, offrant une approche globale qui combine les aspects théoriques, les défis algorithmiques et les solutions d’optimisation pour le HPC (calcul haute performance). L’atelier inclura des études de cas appliquées à la santé (données transcriptomiques, de trajectoires de soins) et aux géosciences (données sismiques, entre autres), afin de souligner l’importance de ces méthodes dans des domaines aux enjeux critiques. Si l’atelier fait émerger d’autres domaines applicatifs dans lesquels le recherche par similarité dans des données séquentielles massives est utiles, ils pourront être intégrés.