Ateliers

Le GDR MaDICS possède des Ateliers, outils de préfiguration des futures Actions.

En 2025, quatre Ateliers sont présents :

Data & Astro

Acronyme : DatAstro

Responsables :

André SCHAAFF, CDS, INSU
Nicolas LUMINEAU, LIRIS, INS2i

Résumé :

En astronomie, comme dans d’autres domaines, les recherches s’appuient en partie sur des analyses fines de grandes masses de données et des simulations à très grande échelle présentant des exigences spécifiques. En astronomie, le changement d’échelle (en termes de données) est également permanent et suit la mise en production des nouveaux instruments toujours plus performants et précis dans leurs mesures. Les environnements informatiques actuels s’appuient sur des architectures HPC confrontées à des difficultés de gestion des données massives. Notre objectif est de renforcer et de mettre en réseau une communauté de chercheurs et d’ingénieurs s’intéressant à ces problématiques.

Explicabilité des Modèles multi-modaux d’Intelligence Artificielle pour intensifier la découverte scientifique

Acronyme : EXMIA

Responsables :

Céline ROBARDET, LIRIS, INS2i
Sebastien FIORUCCI, ICN,INC

Résumé :

L’Atelier EXMIA est un lieu de discussions et d’échanges autour des questions de découvertes scientifiques à partir de modèles de machine learning et de leurs explications. Il rassemble des chercheurs en informatique, chimie, biologie, médecine et neurosciences autour de la modélisation des phénomènes intracellulaires complexes par apprentissage automatique à l’aide de modèle multi-modaux capables de traiter des informations biologiques riches. Ces modèles reposent sur des architectures avancées, telles que les modèles de langage multimodal (LMM) et les réseaux de neurones sur graphes (GNN), qui permettent de relier des données hétérogènes. L’un des défis clés est l’explicabilité de ces modèles, indispensable pour formuler des hypothèses sur les mécanismes sous-jacents des phénomènes étudiés.

Geoscience Knowledge and Interpretation Formalisation

Acronyme : EXMIA

Responsables :

Gautier LAURENT, ISTO, INSU
Christelle LOISELET, Direction Numérique des Géosciences, BRGM
Patrick MARCEL, LIFO, INS2i

ICN,INC

Résumé :

L’Atelier GeoKIF : Geoscience Knowledge and Interpretation Formalisation, vise à faire progresser la recherche en géosciences en facilitant l’échange de connaissances et le développement de nouvelles méthodes numériques pour gérer, analyser et interpréter les données géoscientifiques. L’interdisciplinarité dans le domaine des géosciences est cruciale pour prendre en compte les avancées technologiques qui offrent aujourd’hui de nouvelles perspectives pour une meilleure compréhension de la dynamique du sous sol de notre planète et une gestion plus durable des ressources qu’il contient. L’atelier permettra ainsi de favoriser les échanges entre géologues et informaticiens pour créer une communauté mixte pour répondre à ces enjeux.

Geoscience Similarités de données massives et complexes – Des défis sémantiques à l’optimisation pour le calcul haute performance

Acronyme : EXMIA

Responsables :

Sophie ROBERT, LIFO, INS2i
Lucile MOLLET, CBM, INSB
Christel DARTIGUES-PALLEZ, I3S, INS2i

Résumé :

De nombreux domaines nécessitent l’analyse de grands volumes de données de complexités variées, comme par exemple, des données séquentielles avec différentes granularité, périodicité, complétude, etc., notamment pour évaluer leur similarité. Le choix de la mesure de similarité doit prendre en compte des aspects sémantiques et des aspects calculatoires. Ces deux dimensions sont généralement en tension et un des enjeux du choix est dans le fait de trouver des compromis acceptables. Les solutions informatiques pour arriver à un compromis sont multiples et passent notamment par des approches algorithmiques qui vont bien approximer des métriques ou en rendre leur calcul efficace sur de grands volumes de données. SIMDAC se présente comme un atelier dédié à l’étude des similarités dans les données massives et complexes, offrant une approche globale qui combine les aspects théoriques, les défis algorithmiques et les solutions d’optimisation pour le HPC (calcul haute performance). L’atelier inclura des études de cas appliquées à la santé (données transcriptomiques, de trajectoires de soins) et aux géosciences (données sismiques, entre autres), afin de souligner l’importance de ces méthodes dans des domaines aux enjeux critiques. Si l’atelier fait émerger d’autres domaines applicatifs dans lesquels le recherche par similarité dans des données séquentielles massives est utiles, ils pourront être intégrés.

MaDICS

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Data & Astro

Explicabilité des Modèles multi-modaux d’Intelligence Artificielle pour intensifier la découverte scientifique

Geoscience Knowledge and Interpretation Formalisation

Geoscience Similarités de données massives et complexes – Des défis sémantiques à l’optimisation pour le calcul haute performance