Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : ICube
Durée : 6 mois
Contact : aurelie.leborgne@unistra.fr
Date limite de publication : 2021-01-31
Contexte :
Valoriser les grandes masses de données spatio-temporelles disponibles dans différents domaines est crucial. Ceci nécessite de concevoir et de développer des approches innovantes aptes à traiter conjointement les aspects spatiaux et les aspects temporels, ce qui n’est que peu le cas avec les méthodes actuelles. Si les graphes, outils puissants à la fois théoriquement et méthodologiquement, sont utilisés pour modéliser des phénomènes temporels ou spatiaux, les méthodes actuelles de fouille, d’analyse et d’extraction de connaissances n’exploitent, en général, qu’une seule dimension de l’information, spatiale versus temporelle. Cela implique souvent une perte de précision et possibilité d’interprétation des résultats. C’est pourquoi nous nous proposons d’exploiter un modèle de graphe spécifique intégrant différents types de relations, les graphes spatio-temporels.
Sujet :
L’objectif général est d’étudier et développer des techniques pour trouver dans de grands graphes spatio-temporels, des motifs, ou répétitions, auxquels les experts du domaine concerné peuvent donner sens. Plus précisément, il s’agit de mettre en oeuvre des techniques de recherche de motifs (sous-graphes fréquents) sur des jeux de données réelles : images satellitaires, bd géographiques, IRM fonctionnelle (en relation avec des experts de ces domaines). La ou le stagiaire s’appuiera pour cela sur les outils disponibles au laboratoire (pour la construction des graphes et pour l’extraction des motifs) mais devra aussi adapter ou améliorer ces outils. Les tâches suivantes seront à réaliser :
– Bibliographie
– Sélection et prétraitement des données
– Transformation : génération de graphes spatio-temporels, incluant la modélisation des relations spatiales et spatio-temporelles adéquates
– Recherche des motifs fréquents ; extension de l’approche aux motifs inexacts (approximation des étiquettes, ou du nombre d’arêtes et de sommets) et trajectoires,
– Interprétation et comparaison des résultats sur (au moins) deux jeux de données
En fonction de l’avancée, on pourra aussi envisager de comparer les résultats obtenus en recherchant des motifs inexacts dans des données précises ou des motifs exacts dans des données imprécises (par exemple en utilisant des étiquettes floues ou plus générales). L’objectif final est de construire une chaîne de traitement incluant l’ensemble des opérations sur les données d’un domaine.
Profil du candidat :
Autonome en programmation (de préférence Python), connaissances sur les graphes et les réseaux de neurones, intérêt pour le développement expérimental.
Formation et compétences requises :
Master 2 informatique ou équivalent
Adresse d’emploi :
300 bd Sébastien Brant à Illkirch
Document attaché : 202010150920_stages2021-donneesReelles.pdf