Clustering incrémental avec des approches déclaratives

When:
28/02/2021 – 01/03/2021 all-day
2021-02-28T01:00:00+01:00
2021-03-01T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFO (Laboratoire d’Informatique Fondamentale d’
Durée : 5 ou 6 mois
Contact : thi-bich-hanh.dao@univ-orleans.fr
Date limite de publication : 2021-02-28

Contexte :
Ce stage est lié à un projet national Herelles, financé par l’ANR (Agence National de la Recherche) débutant en Novembre 2020. Dans le cadre de ce projet, nous proposons un stage de recherche de master, qui se déroulera au laboratoire LIFOà Orléans, en partenariat avec le laboratoire GREYC à Caen.

Le projet Herelles comporte aussi un financement de thèse de doctorat dont l’appel à candidature sera publié ultérieurement.

Le stage est d’une durée de 5 ou 6 mois, avec le début à mi-janvier ou début février 2020. Il pourrait éventuellement déboucher sur une thèse.

Les candidats sont encouragés à nous contacter dès que possible. Le dossier de candidature complet se compose des documents ci-dessous, qui est sous forme d’un seul fichier pdf à envoyer à Thi-Bich-Hanh Dao (thi-bich-hanh.dao@univ-orleans.fr) :
• CV
• lettre de motivation
• diplômes et relevés des notes de Licence et Master
• coordonnées de trois personnes de référence au maximum
• éventuellement un certificat de langue anglaise et une liste de publications
• Attention : tous les documents doivent être en anglais ou en français.

Sujet :
Le clustering est une tâche importante en fouille de données, qui vise à partitionner les instances de données en groupes pour trouver la structure sous-jacente. Le clustering a été étendu au clustering sous contraints, qui permet d’intégrer les connaissances préalables, afin de rendre la tâche de clustering plus précise. Les connaissances préalables sont intégrées sous forme de contraintes. La plupart des méthodes de clustering sous contraintes demandent la spécification de toutes les contraintes avant l’exécution ultérieure des méthodes. Dans de nombreuses applications, il est plus raisonnable de permettre à l’utilisateur d’injecter de nouvelles informations sous forme de contraintes sur un résultat de clustering. Les contraintes peuvent être des contraintes sur deux instances qui doivent ou ne peuvent pas être dans un même cluster, ou peuvent être des contraintes sur les clusters, indiquant des limites sur leur taille ou leur diamètre, ou peuvent être des opérations sur clusters, comme scinder un cluster ou fusionner deux clusters, etc.. Le processus de clustering sous contraintes devient donc incrémental. Dans ce cadre incrémental, il est essentiel de profiter des informations fournies par l’utilisateur pour apporter des améliorations à la solution. En même temps, afin d’éviter de dérouter l’utilisateur, le nouveau clustering ne doit pas être trop différent du précédent.

Nous considérerons des approches déclaratives (programmation par contraintes, programmation linéaire en nombres entiers) qui offrent l’expressivité et la satisfaction des contraintes. Dans ce stage, nous visons à:
1. Développer un mécanisme qui facilite l’intégration du retour de l’utilisateur sur un clustering donné.
2. Identifier les contraintes importantes afin de profiter des informations données par l’utilisateur. Cela pourrait se faire en déterminant ou en améliorant une mesure sur l’utilité des contraintes.
3. En même temps, limiter la perturbation du nouveau clustering par rapport au précédent. Une mesure de la similarité de regroupement doit être définie, qui peut être statistique ou plus explicative.

Profil du candidat :
Etudiante ou étudiant en master informatique ou école d’ingénieur en informatique.

Formation et compétences requises :
– Compétences en machine learning/data mining. Bonnes capacités en programmation. Des connaissances en Programmation par Contraintes ou Programmation linéaire en nombres entiers seraient appréciées.
– Le français et/ou l’anglais sont les langues de travail.

Adresse d’emploi :
LIFO, Université d’Orléans

Document attaché : 202011251534_Master-Internship-H-2021.pdf