Actions

Présentation

La notion d’Action d’animation est au centre de MaDICS. Elle recouvre une problématique de recherche partagée par une communauté de chercheurs et de partenaires de diverses disciplines sur des masses de données scientifiques bien identifiées. Une Action propose un projet d’animation de recherche interdisciplinaire coordonnant diverses activités  (journées thématiques ou scientifiques, écoles d’été, études prospectives, proposition ou comparaison de méthodes et d’algorithmes, challenges scientifiques, etc. ).

Une Action et ses activités doivent respecter divers critères, tout particulièrement une visibilité scientifique à travers par exemple la production de rapports prospectifs ou l’organisation de séminaires  ; une animation nationale voire internationale et surtout une forte dimension interdisciplinaire. Les activités peuvent être développées en collaboration avec d’autres instances tels que des grands instruments, centres de calcul, autres organismes, autres GDR, …

Une création d’Action se fait suite à des appels émis par le GDR  MaDICS. Il n’est pas prévu de création au fil de l’eau. Pour consulter l’Appel en cours, rendez-vous sur MaDICS rubrique Actions/Appel.

Afin de favoriser les rencontres et l’interdisciplinarité, de renforcer les collaborations et d’éviter l’éparpillement des forces (et des moyens financiers), une Action est créée pour une durée de vie limitée (2ans, renouvelable une fois) et le nombre d’Actions soutenue en parallèle sera limité. Notez que chaque Action a au moins deux responsables issus d’instituts différents.

Chaque Action devra fournir un rapport d’activité annuel (attendu mi-octobre).

Actions en cours

Détection des anomalies dans l’Environnement (2024-2026)

Acronyme : DAE

Responsables :

Résumé :

Cette Action vise à explorer les méthodologies d’extraction de connaissances et d’analyse de données afin de détecter les anomalies dans les domaines de l’agroalimentaire, de l’environnement et des ressources en eau. En intégrant les avancées en intelligence artificielle et en apprentissage automatique, l’objectif est de développer des solutions durables pour améliorer la gestion des polluants et la qualité de l’eau. L’initiative favorisera la collaboration entre chercheurs, industriels et décideurs pour répondre aux enjeux sociétaux contemporains.

Data Science in Chemistry (2022-2026)

Acronyme : DSChem

Responsables :

Résumé :

L’Action DSChem vise à favoriser les échanges autour de la donnée chimique et de ses possibilités de traitement informatique. Piloté par un comité mixte constitué de chercheurs chimistes ou informaticiens DSchem est un outil de veille et un catalyseur de réseau. L’action organisera des groupes d’étude autour de thématiques choisies comme importante et ayant pour objectif de produire un état de l’art sur un sujet précis. L’action organisera des rencontres physiques ou à distance où les travaux, besoins et solutions pourront être communiqués. Enfin, l’action servira d’annuaire, facilitant les mises en contact et la conception de projets de recherche.

Human Explainable machine Learning Pipeline (2021-2025)

Acronyme : HELP

Responsables :

Résumé :

L’action vise à faire se rencontrer des chercheurs en informatique, spécialistes de la fouille de données et de manipulation de données, argumentation et traçabilité (INS2I) et des chercheurs en sciences humaines et sociales, spécialistes du discours explicatif et des mécanismes cognitifs en prise avec l’élaboration d’explications (INSHS) [Miller, 2019], en interaction avec des spécialistes industriels ayant des problématiques d’explication liée à l’exploitation automatique de leurs données à travers des pipelines de bout-en-bout allant des données brutes aux résultats d’analyse finaux. L’objectif de ces rencontres est : (i) De mieux comprendre les mécanismes sousjacents à une explication et à sa réception et de produire une typologie des problèmes d’explications en fonction des scénarios d’usage en informatique : en fonction des données et des prétraitements de données effectués dessus, de l’utilisateur et de la nature de la méthodes qui traite les données (clustering, classification,recommandation) ; (ii) De produire des algorithmes interactifs, suivant le principe UXAI (User Centric eXplainable AI), permettant d’accompagner un utilisateur dans la co-construction d’une explication portant principalement sur les phases de prétraitement de données ; (iii) De définir des méthodes d’évaluation de la qualité d’une explication, en lien avec les utilisateur mais aussi les données sur lesquelles reposent le processus d’analyse.

Modélisation multi-échelle de masses de données musicales (2022-2025)

Acronyme : Musiscale

Responsables :

Résumé :

La masse de données musicales disponibles de nos jours représentent une richesse considérable d’un point de vue culturel et créatif, ainsi qu’en terme de capacité de valorisation éducative et industrielle.

Le but de cet atelier est d’amorcer une réflexion collective sur des paradigmes de représentation et de traitement des données musicales visant à rendre compte de la structure de leur organisation à différentes échelles. On privilégiera les approches se rattachant à la théorie de l’information, pouvant s’appliquer aux données musicales. On espère ainsi pouvoir faire mieux converger les visions informatiques, musicologiques, cognitives et applicatives dans la façon d’appréhender ces données.

Des sources aux données historiques en humanités numériques (2024-2026)

Acronyme : SaD-2HN

Responsables :

Résumé :

Cette Action vise à explorer les méthodologies d’extraction de connaissances et d’analyse de données afin de détecter les anomalies dans les domaines de l’agroalimentaire, de l’environnement et des ressources en eau. En intégrant les avancées en intelligence artificielle et en apprentissage automatique, l’objectif est de développer des solutions durables pour améliorer la gestion des polluants et la qualité de l’eau. L’initiative favorisera la collaboration entre chercheurs, industriels et décideurs pour répondre aux enjeux sociétaux contemporains.

Simplification et Vulgarisation des Textes Scientifiques (2021-2026)

Acronyme : SimpleText

Responsables :

Résumé :

La simplification des textes est essentielle pour améliorer l’accessibilité à l’information. L’action SimpleText vise à créer une communauté dédiée à rendre l’information scientifique, juridique et administrative plus accessible, en facilitant la recherche et en optimisant le traitement automatique du langage. Dans un contexte de désinformation, la littératie scientifique est cruciale, mais l’accès aux sources scientifiques est souvent entravé par un langage complexe. Par exemple, bien que la recherche biomédicale puisse influencer directement les décisions de santé des individus, la plupart des sources fiables en biomédecine utilisent un langage compliqué et supposent un niveau élevé de connaissances préalables, ce qui les rend difficiles à comprendre pour le grand public. La simplification des textes juridiques et administratifs rend l’information accessible et compréhensible pour tous, renforçant ainsi la transparence, la participation citoyenne et l’efficacité des procédures.

L’émergence des grands modèles de langage (LLMs) transforme l’accès à l’information grâce à l’IA, nécessitant une réévaluation des compétences requises pour naviguer dans cet environnement. Les cadres de littératie de l’information, basés sur des systèmes traditionnels, doivent évoluer. La simplification des textes et la création d’une communauté autour de cet objectif sont primordiales pour rendre l’information plus compréhensible et accessible dans un monde numérique en constante évolution.

Traitement Informatique des Données de Santé (2024-2026)

Acronyme : TIDS

Responsables :

Résumé :

L’exploitation secondaire des données de santé correspond à l’utilisation de données collectées initialement au cours des soins (contexte de soins des patients) ou des études cliniques (contexte de la recherche clinique). L’évolution des méthodes et technologies informatiques ouvre de nouvelles perspectives dans le traitement de données médicales et cliniques. Cependant, ces possibilités sont rapidement limitées par l’accès difficile aux données cliniques. L’objectif principal de l’Action TIDS consiste à échanger sur les problématiques liées à l’accès et l’exploitation secondaire des données de santé. Ces échanges se tiendront entre participants venant de domaines différents (médical, informatique, juridique, SHS…). En particulier, un accent sera mis sur l’identification des pratiques ayant réussi à faciliter l’accès aux données cliniques et à permettre leur partage avec la communauté de recherche.