Gestion de la performance et de la qualité de la détection parallèle des anomalies à large échelle

When:
11/03/2024 all-day
2024-03-11T01:00:00+01:00
2024-03-11T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIAS/SAE-ENSMA
Durée : 36 mois
Contact : amin.mesmoudi@univ-poitiers.fr
Date limite de publication : 2024-03-11

Contexte :
La détection automatique d’anomalies joue un rôle critique dans une variété de domaines, notamment la cybersécurité, la maintenance prédictive et la surveillance de systèmes complexes. Les progrès récents dans le domaine de l’apprentissage automatique ont ouvert de nouvelles perspectives pour le développement de méthodes prometteuses de détection d’anomalies, en particulier lorsqu’il s’agit de données complexes telles que les graphes [1,5,6,7,8] et les séries temporelles [2,3,4].
Dans ce contexte, la gestion efficace de gros volumes de données est devenue cruciale pour la détection d’anomalies à grande échelle. Les systèmes modernes génèrent une quantité massive de données en temps réel [6], ce qui rend impératif d’adapter les méthodes de détection d’anomalies pour traiter ces flux de données de manière efficace. Cela nécessite non seulement une préparation de données efficace pour nettoyer, intégrer et étiqueter les données, mais aussi une parallélisation habile de l’exécution des algorithmes de détection d’anomalies. En tirant parti de la puissance du calcul distribué et des infrastructures de traitement de données à grande échelle, nous pourrons améliorer la réactivité et l’évolutivité de nos approches de détection d’anomalies, ce qui est essentiel pour répondre aux besoins des applications modernes. Par conséquent, la conception des algorithmes de détection d’anomalie devrait, en plus de la prise en compte des questions liées à la qualité de la détection, se pencher sur des questions telles que : comment stocker, organiser et indexer les données complexes ? Comment combiner l’indexation et la gestion de la mémoire pour des jeux de données extrêmement volumineuses, distribuées et multidimensionnelles ?

Sujet :
Les techniques de détection d’anomalies doivent évoluer pour prendre en considération les environnements modernes de déploiement et ainsi faire face aux nouveaux défis engendrés par les données massives. Dans cette thèse, les contributions scientifiques attendues sont principalement liées à :
1) l’identification des goulots d’étranglement entravant les techniques de détection d’anomalies actuelles pour leur permettre de passer à l’échelle, et
2) le développement de nouvelles techniques de détection des anomalies qui prennent en charge la parallélisation massive des traitements sur de vastes volumes de données.

Profil du candidat :
Le candidat recherché devrait :
1. Être titulaire d’un diplôme de niveau Bac +5 en informatique ou en mathématiques appliquées, avec un intérêt pour la recherche.
2. Posséder une expertise en Machine Learning et en gestion de données à large échelle.
3. Avoir des compétences analytiques avancées et une capacité à résoudre des problèmes complexes.
4. Posséder une aptitude à communiquer à l’oral et à l’écrit en français et en anglais.

Formation et compétences requises :
Le candidat recherché devrait :
1. Être titulaire d’un diplôme de niveau Bac +5 en informatique ou en mathématiques appliquées, avec un intérêt pour la recherche.
2. Posséder une expertise en Machine Learning et en gestion de données à large échelle.
3. Avoir des compétences analytiques avancées et une capacité à résoudre des problèmes complexes.
4. Posséder une aptitude à communiquer à l’oral et à l’écrit en français et en anglais.

Adresse d’emploi :
Laboratoire LIAS – ISAE-ENSMA
Téléport 2 – 1 avenue Clément Ader
BP 40109
86961 Chasseneuil
France

Document attaché : 202402031347_2024_lias_idd_managing_performance_quality_anomaly_detection_en_fr(1).pdf