RoCED

 

Action RoCED – GDR IA (2021-2023)

Reasoning on Complex and Evolving Data

Responsables

Correspondant ComDIR :

Thématiques

Cette Action est inter-GDR (MaDICS et IA), avec deux thématiques centrales : la gestion de données hétérogènes de complexité et de qualité variables (sciences des données), et la représentation de connaissances et les raisonnements (intelligence artificielle)

Données concernées

Données de capteurs, Flux de données, Données spatio-temporelles, Données personnelles, Données hétérogènes, Données incertaines

Mots clés

Algorithmes, Intégration de données massives, complexes et hétérogènes, Liage de données et traitement de données liées, Découverte de connaissances, Raisonnements sur des données imparfaites, Raisonnement dans des environnements contraints, Raisonnement spatio-temporel, Explicabilité, Données massives, Benchmarks.

Contexte scientifique

Durant la dernière décennie la communauté scientifique internationale et française s’est beaucoup intéressée aux processus de publication et de raffinement de données et de connaissances grâce à des initiatives comme le Linked Open Data et TeraData. Une multitude de méthodes et de systèmes ont été développés pour répondre aux problématiques liées à l’acquisition, la publication et l’exploitation des données et des connaissances. Des avancées considérables ont été réalisées pour la construction de graphes de connaissances, l’alignement d’ontologies, le liage de données, la prédiction/l’invalidation de liens dans les graphes de connaissances, mais aussi dans le domaine de la représentation de connaissances et le raisonnement via des systèmes d’OBDA (Ontology-based Data Access). Dans ce contexte, les différents algorithmes de raisonnement symbolique ont montré leur importance et leur efficacité pour différentes tâches, comme l’interrogation multi-sources, le liage de données et l’invalidation de liens dans les graphes de connaissances. Cependant, des efforts importants sont nécessaires pour prendre en compte toutes les dimensions qui caractérisent les données et les connaissances auxquelles les systèmes sont amenés à faire face.

Dans cette Action, nous nous focaliserons notamment sur la complexité, l’hétérogénéité, l’incertitude et l’évolution des données et des connaissances. Des caractéristiques spécifiques à certains domaines comme l’aspect spatiotemporel, les données à caractère personnel et la qualité des données produites par des dispositifs électroniques dus à leurs contraintes physiques et matérielles (e.g. mémoires, CPU, énergie) vont également être déterminantes et doivent être prises en compte lors de la conception des systèmes de raisonnement exploitant ces données et connaissances.

Un des champs d’application où les défis scientifiques mentionnés plus haut sont pour la plupart posés est le domaine de l’internet des objets (IoT). L’évolution des performances et du rayonnement de l’Internet (5G notamment) ainsi que la multitude d’objets connectés disponibles sur le marché génèrent de nos jours une masse de données hétérogènes de plus en plus complexes, volumineuses et évolutives. Les systèmes informatiques doivent donc s’adapter à ces volumes de données aux caractéristiques propres tout en considérant qu’une partie de ces données peuvent être à caractère personnel et doivent donc être traitées en respectant les législations en vigueur, tout en répondant au mieux aux besoins des utilisateurs.

Cette Action se focalise sur les systèmes informatiques embarquant du raisonnement pour aider à la prise de décision à partir de flux de données hétérogènes, complexes et personnelles.

La prise de décision reposant sur une approche par raisonnement présente l’avantage de pouvoir expliquer la décision proposée. Plusieurs types de raisonnement peuvent être mis en oeuvre sur les données produites dans le cadre de l’IoT :

  • raisonnement spatial
  • raisonnement temporel
  • raisonnement dans des environnements contraints
  • raisonnement sur des données incertaines
  • raisonnement et incomplétude
  • raisonnement sur des gros volumes de données
  • raisonnement et mondes ouvert / fermé
  • raisonnement distribué
  • raisonnement pour la vie privée (politique d’accès aux données, anonymisation, réécriture de requêtes…)
  • hybridation du raisonnement et de l’apprentissage automatique
  • etc…

Les différentes problématiques citées précédemment doivent également être confrontées à la réalité du terrain afin de valider leur adéquation par rapport à des besoins réels. Pour ce faire, nous identifierons plusieurs jeux de données représentatifs de situations réelles pour favoriser l’évaluation des approches de raisonnement sur des données et connaissances complexes, spatio-temporelles et évolutives.

Notre Action peut être vu comme une initiative d’animation de la recherche proposant des solutions complémentaires à celles traitées dans l’Action DOING.

Cette Action, comme l’action RoCED, a également le soutien du GDR IA.

 

Visitez le site web de l’Atelier RoCED



Évènements à venir