Thèse de doctorat (H/F) : approche bayésienne et problèmes inverses pour l’estimation des propriétés de galaxies

When:
15/09/2024 all-day
2024-09-15T02:00:00+02:00
2024-09-15T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CRIStAL UMR 9189 – Lille
Durée : 36 mois
Contact : pierre.chainais@centralelille.fr
Date limite de publication : 2024-09-15

Contexte :
Ce projet de thèse interdisciplinaire entre science des données et cosmologie s’inscrit dans le cadre d’une collaboration entre l’équipe SigMA du laboratoire CRIStAL (Lille) et l’équipe GEPI de l’observatoire de Paris. Il est financé par une thèse 80|Prime de la MITI du CNRS.

L’équipe encadrante est constituée de Pierre Chainais (http://pierrechainais.ec-lille.fr/) et Jenny Sorce (https://jennygsorce.appspot.com/) (CRIStAL/ SigMA) d’une part, et de Mathieu Puech (https://mathieu-puech.jimdosite.com/) et Hector Flores (Obs. de Paris / GEPI) d’autre part.

La thèse sera hébergée au laboratoire CRIStAL (Lille) dans l’équipe SigMA (https://www.cristal.univ-lille.fr/equipes/sigma/). L’équipe SigMA est reconnue pour son expertise en problèmes inverses et leurs applications en astrophysique au sens large. La présence, au sein de l’équipe SigMA, de Jenny Sorce, cosmologiste, assure un environnement interdisciplinaire quotidien. Des séjours à l’observatoire de Paris sont prévus.

Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l’autorité compétente du MESR.

Sujet :
URL publique de l’offre : /Offres/Doctorant/UMR9189-JENSOR-001/Default.aspx

Référence : UMR9189-JENSOR-001

Type de contrat : CDD Doctorant/Contrat doctoral CNRS – acquis (thèse 80|Prime de la MITI)
Lieu de travail : CRIStAL, Villeneuve d’Ascq
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2024 (date négociable)
La rémunération est d’un minimum de 2135,00 € mensuel
Section(s) CN : Sciences de l’information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues

Nom du responsable scientifique : Pierre Chainais, Jenny Sorce (CRIStAL) et Mathieu Puech (GEPI)

Description du sujet de thèse

Résumé en français (voir sujet détaillé ci-dessous) :

Le modèle cosmologique standard postule que matière noire et énergie sombre constituent ~95 % de l’Univers. Des analyses de relevés de galaxies révèlent des contradictions entre observations et modèle. L’inférence des paramètres cosmologiques à partir des propriétés de galaxies résulte d’une chaîne de traitement complexe impliquant observations et théories astrophysiques, sciences du numérique et des données. Le débat consiste à déterminer si ces tensions proviennent d’une nouvelle physique ou d’approximations entraînant des biais systématiques. Ce projet vise à perfectionner la chaîne d’inférence en utilisant les simulations CLONES, fournies par CRIStAL, comme vérité-terrain, les images multi-longueurs d’onde et les spectres de galaxies de l’équipe GEPI, et les dernières avancées en termes d’inférence Bayésienne et d’apprentissage automatique de l’équipe CRIStAL/SigMA. En inférant sans biais, grâce aux sondages de l’univers, son taux d’expansion, ce projet pourrait résoudre le paradoxe apparent du décalage entre valeurs théorique et inférée de ce taux.

Mots clefs : Problèmes inverses – Inférence Bayésienne – Apprentissage automatique – Galaxies – Cosmologie

Sujet détaillé :
Selon le modèle cosmologique standard, la matière noire et l’énergie sombre constituent environ 95% de l’Univers. Les récentes analyses de grands relevés de galaxies révèlent des tensions avec ce modèle. Par exemple, la mesure locale du taux d’expansion et l’estimation de l’homogénéité de l’Univers diffèrent de plus de trois écarts-types de celles déduites de la première lumière de l’Univers. Le débat consiste à déterminer si ces tensions sont synonymes de nouvelles physiques ou d’effets systématiques dus à la longue chaîne de traitement des observations.

L’inférence de paramètres cosmologiques, comme le taux d’expansion, à partir des propriétés d’objets astronomiques tels que des galaxies et les amas de galaxies, appelés sondes, est un processus complexe. Elle nécessite de multiples domaines d’expertise : observation astronomique, théorie astrophysique, sciences du numérique et des données. Cependant, les différentes communautés n’interagissent que rarement. Ces découplages Rss/ EmploiCNERmS)ploiCNRS) communautaires peuvent entraîner des biais systématiques dans la chaîne de traitement des observations, et, par conséquent, dans l’estimation finale des paramètres cosmologiques.

Par exemple, une partie de cette chaîne s’appuie sur des simulations cosmologiques utilisées comme vérité-terrain, manquante en cosmologie. Ces données synthétiques issues de la simulation de modèles astrophysiques encodent notre compréhension physique des phénomènes. Cette compréhension, et donc les simulations, sont en général la clef de toute procédure d’inférence. Pour garantir la prise en compte de tous les aspects, ces simulations s’enrichissent et deviennent de plus en plus complexes et volumineuses. L’objectif est ensuite de tirer parti de ces données de façon optimale en exploitant les dernières avancées en matière d’inférence Bayésienne et d’apprentissage automatique. Cependant, les simulations cosmologiques standard ne reproduisent que statistiquement la toile cosmique.

Un nouveau type de simulations, qualifiées de contraintes, a fait son apparition. Les champs de vitesse et de densité initiaux de telles simulations sont contraints par les observations de l’Univers local (~200 Mpc de rayon). Ainsi, les simulations contraintes obtenues ressemblent à l’Univers local observé non seulement statistiquement, mais aussi dans le détail des objets-sondes qui le constituent (galaxies et amas de galaxies). Les CLONES, jumeaux numériques ou ‘digital twins’ de l’Univers local, fournies par la porteuse du projet constituent de telles simulations. Jouant le rôle de vérité- terrain manquante, ces simulations permettent de quantifier et de minimiser certaines sources de biais : particularités de l’environnement local en tant que lieu d’observation et zone observée, limites des modèles astrophysiques et des méthodes calibrées pour dériver les propriétés des galaxies et amas de galaxies, spécificités des relevés et sondages, etc.

Ce projet vise à améliorer l’exactitude et l’efficacité de la chaîne de traitement des observations. Il s’agit de franchir un cap décisif quant à l’estimation des paramètres cosmologiques, en tirant parti des simulations CLONES de la porteuse du projet de CRIStAL/SigMA (INS2I), de la multitude de données multi-longueurs d’onde et des spectres de galaxies disponibles, notamment via les missions d’observation dans lesquelles est impliquée l’équipe partenaire GEPI (INSU), et des récentes avancées en matière de traitement du signal et de résolution de problèmes inverses de l’équipe CRIStAL/SigMA (INS2I).

Côté science des données, les enjeux seront de résoudre le problème inverse qui relie les propriétés des galaxies aux observations qui en sont faites, puis celui qui lie le taux d’expansion de l’Univers à l’ensemble des propriétés des galaxies. La difficulté sera d’inclure les particularités individuelles des galaxies (biais d’environnement et redshift) et globales des relevés (biais de sélection), mais aussi de prendre en compte l’incertitude des observations (bruits instrumentaux) et des observables (erreur de mesure et limite des modèles théoriques). Pour que les estimations obtenues permettent, le cas échéant, de lever définitivement le paradoxe cosmologique, les propriétés inférées devront être accompagnées d’une quantification des incertitudes, de la mesure à l’inférence elle-même.

Il s’agira de développer des algorithmes d’inférence pour résoudre des problèmes inverses sur de grands jeux de données multimodales (spectres et images, observables et propriétés), avec de multiples sources d’incertitude (par exemple, variance intrinsèque, bruits de mesures, erreur de mesure) et de biais (environnement, redshift) à prendre en compte, en passant par la case compression optimale, et en fournissant des intervalles de crédibilité.

Côté astrophysique, les enjeux seront de déterminer avec précision et exactitude les propriétés des galaxies-sondes à partir de leurs observations multiples (images multi-longueurs d’onde et spectres), puis d’en inférer le taux d’expansion de l’Univers associé pour lever le paradoxe fondamental du décalage entre observations astronomiques et modèle standard cosmologique.

Profil du candidat :
Diplôme d’ingénieur ou M2 en science des données, traitement du signal, mathématiques appliquées ou équivalent, avec un intérêt pour l’astrophysique et la cosmologie.

Formation et compétences requises :
Bonne compréhension de la modélisation mathématique des systèmes physiques.

Bonne culture mixte entre théorie et pratique, des connaissances et compétences en problèmes inverses et/ou apprentissage profond seraient un plus.

Anglais bon niveau requis.

Adresse d’emploi :
UMR CRIStAL
Université de Lille – Campus scientifique
Bâtiment ESPRIT
Avenue Henri Poincaré
59655 Villeneuve d’Ascq