Méthodes d’échantillonnage pour l’inférence ...
Document type :
Thèse
Title :
Méthodes d’échantillonnage pour l’inférence statistique de problèmes inverses non linéaires : distribution spatiale des propriétés physico-chimiques du milieu interstellaire
English title :
Sampling methods for statistical inference of non-linear inverse problems : spatial distribution of physico-chemical properties of the interstellar medium
Author(s) :
Palud, Pierre [Auteur]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Laboratoire d'Etude du Rayonnement et de la Matière en Astrophysique et Atmosphères = Laboratory for Studies of Radiation and Matter in Astrophysics and Atmospheres [LERMA]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Laboratoire d'Etude du Rayonnement et de la Matière en Astrophysique et Atmosphères = Laboratory for Studies of Radiation and Matter in Astrophysics and Atmospheres [LERMA]
Thesis director(s) :
Pierre Chainais
Franck Le Petit
Franck Le Petit
Defence date :
2023-12-07
Jury president :
Jérôme Idier
Olivier Berné
Florence Forbes
Emilie Habart
Emeric Bron
Pierre-Antoine Thouvenin
Olivier Berné
Florence Forbes
Emilie Habart
Emeric Bron
Pierre-Antoine Thouvenin
Jury member(s) :
Jérôme Idier
Olivier Berné
Florence Forbes
Emilie Habart
Emeric Bron
Pierre-Antoine Thouvenin
Olivier Berné
Florence Forbes
Emilie Habart
Emeric Bron
Pierre-Antoine Thouvenin
Accredited body :
Centrale Lille
Doctoral school :
ED n°631 - Mathématiques, sciences du numérique et de leurs interactions (MADIS)
Keyword(s) :
Apprentissage statistique
Problèmes inverses
Algorithmes MCMC
Milieu interstellaire
Nuages moléculaires
Régions de photodissociation
Problèmes inverses
Algorithmes MCMC
Milieu interstellaire
Nuages moléculaires
Régions de photodissociation
English keyword(s) :
Inverse problems
MCMC ALGORITHMS
Interstellar medium
Molecular clouds
Photodissociation regions
Machine learning
MCMC ALGORITHMS
Interstellar medium
Molecular clouds
Photodissociation regions
Machine learning
HAL domain(s) :
Informatique [cs]/Traitement du signal et de l'image [eess.SP]
Physique [physics]/Astrophysique [astro-ph]/Astrophysique galactique [astro-ph.GA]
Physique [physics]/Astrophysique [astro-ph]/Astrophysique galactique [astro-ph.GA]
French abstract :
Le milieu interstellaire (MIS) est un milieu très diffus qui remplit l’immense volume entre les objets célestes tels que les étoiles et les trous noirs au sein d’une galaxie. L’étude du MIS soulève des questions fondamentales ...
Show more >Le milieu interstellaire (MIS) est un milieu très diffus qui remplit l’immense volume entre les objets célestes tels que les étoiles et les trous noirs au sein d’une galaxie. L’étude du MIS soulève des questions fondamentales dont la formation d’étoiles. Les étoiles naissent de l’effondrement gravitationnel de parties de régions froides et denses du MIS appelées nuages moléculaires.Cette thèse analyse des cartes multispectrales de nuages moléculaires dans les domaines infrarouge lointain et radio, obtenues par des télescopes spatiaux ou terrestres. L’attention est portée aux nuages illuminés et chauffés par des étoiles massives voisines émettant des photons UV. La couche de surface de tels nuages, où le champ radiatif UV chauffe et dissocie le gaz moléculaire, est appelée région de photodissociation (PDR). Leur cartes multispectrales contiennent typiquement de 1 à 10 000 pixels, où chaque pixel contient l’intensité intégrée de 5 à 30 raies d’émission. Ces intensités peuvent être comparées avec les prédictions d’un modèle numérique du MIS tel que le code PDR de Meudon, qui calcule ces intensités à partir de paramètres physiques. Cette thèse vise à estimer des cartes de paramètres physiques (tels que la pression thermique ou l’intensité du champ UV incident) à partir d’une carte d’observation et du code PDR de Meudon. Ce problème est une instance d’une classe générale de problèmes inverses.Une nouvelle méthode d’inférence tenant compte d’autant de sources d’incertitudes que possible est introduite. Une procédure générale est proposée pour construire une approximation de modèles numériques. Elle exploite un réseau de neurones spécifique et surpasse les méthodes d’interpolation en terme de précision, de poids mémoire et de durée d’évaluation. Une régularisation spatiale améliore les estimations. Une approche par échantillonnage est considérée pour fournir des quantification d’incertitudes en plus d’estimateurs ponctuels de cartes de paramètres physiques afin de compenser l’absence vérité terrain, inhérente à l’astrophysique. L’algorithme Monte Carlo Markov chain (MCMC) proposé combine deux échantillonneurs: l’un identifie les minima locaux dans l’espace des paramètres tandis que l’autre les explore efficacement. Finale- ment, la pertinence du modèle d’observation considéré pour l’inférence est vérifiée. La méthode proposée est appliquée à des données synthétiques pour validation, puis à des observations réelles. Les résultats sont analysés pour fournir des interprétations astrophysiques.Show less >
Show more >Le milieu interstellaire (MIS) est un milieu très diffus qui remplit l’immense volume entre les objets célestes tels que les étoiles et les trous noirs au sein d’une galaxie. L’étude du MIS soulève des questions fondamentales dont la formation d’étoiles. Les étoiles naissent de l’effondrement gravitationnel de parties de régions froides et denses du MIS appelées nuages moléculaires.Cette thèse analyse des cartes multispectrales de nuages moléculaires dans les domaines infrarouge lointain et radio, obtenues par des télescopes spatiaux ou terrestres. L’attention est portée aux nuages illuminés et chauffés par des étoiles massives voisines émettant des photons UV. La couche de surface de tels nuages, où le champ radiatif UV chauffe et dissocie le gaz moléculaire, est appelée région de photodissociation (PDR). Leur cartes multispectrales contiennent typiquement de 1 à 10 000 pixels, où chaque pixel contient l’intensité intégrée de 5 à 30 raies d’émission. Ces intensités peuvent être comparées avec les prédictions d’un modèle numérique du MIS tel que le code PDR de Meudon, qui calcule ces intensités à partir de paramètres physiques. Cette thèse vise à estimer des cartes de paramètres physiques (tels que la pression thermique ou l’intensité du champ UV incident) à partir d’une carte d’observation et du code PDR de Meudon. Ce problème est une instance d’une classe générale de problèmes inverses.Une nouvelle méthode d’inférence tenant compte d’autant de sources d’incertitudes que possible est introduite. Une procédure générale est proposée pour construire une approximation de modèles numériques. Elle exploite un réseau de neurones spécifique et surpasse les méthodes d’interpolation en terme de précision, de poids mémoire et de durée d’évaluation. Une régularisation spatiale améliore les estimations. Une approche par échantillonnage est considérée pour fournir des quantification d’incertitudes en plus d’estimateurs ponctuels de cartes de paramètres physiques afin de compenser l’absence vérité terrain, inhérente à l’astrophysique. L’algorithme Monte Carlo Markov chain (MCMC) proposé combine deux échantillonneurs: l’un identifie les minima locaux dans l’espace des paramètres tandis que l’autre les explore efficacement. Finale- ment, la pertinence du modèle d’observation considéré pour l’inférence est vérifiée. La méthode proposée est appliquée à des données synthétiques pour validation, puis à des observations réelles. Les résultats sont analysés pour fournir des interprétations astrophysiques.Show less >
English abstract : [en]
The interstellar medium (ISM) is a very diffuse medium that fills the extraordinarily large volume between celestial objects such as stars and black holes in a galaxy. The study of the ISM raises fundamental questions ...
Show more >The interstellar medium (ISM) is a very diffuse medium that fills the extraordinarily large volume between celestial objects such as stars and black holes in a galaxy. The study of the ISM raises fundamental questions including star formation. Stars are born from the gravitational collapse of a part of cold and dense regions of the ISM called molecular clouds.This thesis analyzes multispectral maps of molecular clouds in the infrared and radio domains, observed by space or ground telescopes. The focus is put on clouds that are illuminated and heated by nearby massive stars emitting UV photons. The surface layer of such clouds, where the UV irradiation heats and dissociates the molecular gas, is called a photodissociation region (PDR). Their multispectral maps typically contain from 1 to 10 000 pixels, where each pixel contains the integrated intensities of 5 to 30 emission lines. These intensities can be compared with the predictions of an ISM numerical model such as the Meudon PDR code that computes intensities from physical parameters. This thesis aims at estimating maps of physical parameters (such as the thermal pressure or the intensity of the incident UV field) from an observation map and the Meudon PDR code. This problem is an instance of a general class of inverse problems.A new inference method that accounts for as many uncertainty sources as possible is introduced. A general procedure to derive a surrogate approximation of numerical models is proposed. It is based on a specific neural network and outperforms interpolation methods in accuracy, memory weight and evaluation time. A spatial regularization improves estimations. A sampling approach is considered to provide uncertainty quantification along with the estimated physical parameter maps to address the absence of ground truth, inherent to astrophysics. The proposed Monte Carlo Markov Chain (MCMC) algorithm combines two samplers: one identifies local min- ima in the parameters space while the second efficiently explores them. Finally, the relevance of the observation model considered for inference is assessed. The proposed method is applied to synthetic data for validation and then to real observations. The results are analyzed for astrophysical interpretation.Show less >
Show more >The interstellar medium (ISM) is a very diffuse medium that fills the extraordinarily large volume between celestial objects such as stars and black holes in a galaxy. The study of the ISM raises fundamental questions including star formation. Stars are born from the gravitational collapse of a part of cold and dense regions of the ISM called molecular clouds.This thesis analyzes multispectral maps of molecular clouds in the infrared and radio domains, observed by space or ground telescopes. The focus is put on clouds that are illuminated and heated by nearby massive stars emitting UV photons. The surface layer of such clouds, where the UV irradiation heats and dissociates the molecular gas, is called a photodissociation region (PDR). Their multispectral maps typically contain from 1 to 10 000 pixels, where each pixel contains the integrated intensities of 5 to 30 emission lines. These intensities can be compared with the predictions of an ISM numerical model such as the Meudon PDR code that computes intensities from physical parameters. This thesis aims at estimating maps of physical parameters (such as the thermal pressure or the intensity of the incident UV field) from an observation map and the Meudon PDR code. This problem is an instance of a general class of inverse problems.A new inference method that accounts for as many uncertainty sources as possible is introduced. A general procedure to derive a surrogate approximation of numerical models is proposed. It is based on a specific neural network and outperforms interpolation methods in accuracy, memory weight and evaluation time. A spatial regularization improves estimations. A sampling approach is considered to provide uncertainty quantification along with the estimated physical parameter maps to address the absence of ground truth, inherent to astrophysics. The proposed Monte Carlo Markov Chain (MCMC) algorithm combines two samplers: one identifies local min- ima in the parameters space while the second efficiently explores them. Finally, the relevance of the observation model considered for inference is assessed. The proposed method is applied to synthetic data for validation and then to real observations. The results are analyzed for astrophysical interpretation.Show less >
Language :
Anglais
ANR Project :
Collections :
Source :
Files
- document
- Open access
- Access the document
- manuscript_pierrepalud_final.pdf
- Open access
- Access the document