• English
    • français
  • Help
  •  | 
  • Contact
  •  | 
  • About
  •  | 
  • Login
  • HAL portal
  •  | 
  • Pages Pro
  • EN
  •  / 
  • FR
View Item 
  •   LillOA Home
  • Liste des unités
  • Autres travaux scientifiques
  • View Item
  •   LillOA Home
  • Liste des unités
  • Autres travaux scientifiques
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Contribution à la classification non-supervisée ...
  • BibTeX
  • CSV
  • Excel
  • RIS

Document type :
Habilitation à diriger des recherches
Permalink :
http://hdl.handle.net/20.500.12210/59453
Title :
Contribution à la classification non-supervisée à base de modèles
English title :
Contribution to model-based clustering of heterogeneous data
Author(s) :
Vandewalle, Vincent [Auteur] orcid refId
METRICS : Evaluation des technologies de santé et des pratiques médicales - ULR 2694
Thesis director(s) :
Preda, Cristian
Defence date :
2021-01-07
Jury president :
Saracco, Jérôme
Accredited body :
Université de Lille
Doctoral school :
École doctorale des sciences pour l'ingénieur
Keyword(s) :
Classification non-supervisée
Modèles de mélanges gaussiens
Estimation de paramètres
Variables latentes
Données manquantes
Algorithmes EM
Sélection de modèles
Inférence bayésienne
Statistique médicale
English keyword(s) :
Unsupervised classification
Gaussian mixtures models
Parameters estimation
Latent variables
Missing data
EM algorithms
Model selection
Bayesian inference
Medical statistics
French abstract :
Je suis Maître de Conférences à l'Université de Lille depuis 2010. Dans la continuité de ma thèse soutenue en 2009 sur la classification semi-supervisée, mes travaux de recherche ont porté sur la classification non-supervisée ...
Show more >
Je suis Maître de Conférences à l'Université de Lille depuis 2010. Dans la continuité de ma thèse soutenue en 2009 sur la classification semi-supervisée, mes travaux de recherche ont porté sur la classification non-supervisée à base de modèles. Ces modèles sont des outils particulièrement utiles qui permettent de réaliser de la classification non-supervisée des données par l'inférence d'un modèle probabiliste. Il est possible de classifier tout type de données dès lors qu'un modèle est disponible pour ce type de données, ce qui permet d'utiliser des outils statistiques standard tels que la sélection de modèles pour justifier certains choix comme celui du nombre de classes. Dans le cadre de la classification non supervisée à base de modèles, j'ai travaillé sur la proposition de modèles permettant la classification de données contenant différents types de variables, en particulier des variables catégorielles, mixtes ou fonctionnelles. J'ai travaillé sur le problème de la classification non supervisée à partitions multiples qui consiste à rechercher plusieurs variables latentes de classe, ce qui permet au modèle de révéler plusieurs points de vue de classification. Enfin, je me suis intéressé à des questions plus générales, comme le problème du label-switching, la prise en compte des données manquantes ou la visualisation du résultat d'un mélange. Dans une autre partie de mes recherches, j'ai travaillé sur des questions liées aux applications. Dans ce cadre, j'ai travaillé sur l'étude de l'utilisabilité des dispositifs médicaux par la modélisation de la matrice de découverte, permettant ainsi au fabricant d'évaluer la complétude du processus de découverte et d'évaluer ses performances. J'ai travaillé sur la question du credit-scoring par l'automatisation du prétraitement en l'intégrant dans l'estimation du modèle. Enfin, j'ai travaillé sur les données de vol des avions afin de proposer une optimisation de la trajectoire de l'avion basée sur les données de vol disponibles. Ces différents travaux de recherche ont été réalisés dans le cadre de projets de recherche et ont donné lieu à des publications dans des revues à comité de lecture. Tout au long de ces travaux, j'ai participé à la supervision de stages, de thèses, de post-doctorants et d'ingénieurs. Dans ce manuscrit, je présente une synthèse de mes travaux de recherche ainsi que les projets de recherche qui en résultent.Show less >
English abstract : [en]
I am Assistant Professor at the University of Lille since 2010. In the continuity of my thesis defended in 2009 on semi-supervised classification, my research work has focused on model-based clustering. These models are ...
Show more >
I am Assistant Professor at the University of Lille since 2010. In the continuity of my thesis defended in 2009 on semi-supervised classification, my research work has focused on model-based clustering. These models are particularly useful tools that permit to perform clustering of data through the inference of a probabilistic model. It can cluster any kind of data as soon as some model is available for this kind of data, enabling to use standard statistical tools such as model selection to rationale some choices such as the number of clusters. In the scope of model-based clustering, I have worked on the proposal of models allowing the clustering of data containing different kinds of variables, in particular taking into account categorical, mixed or functional variables. I have worked on the problem of multiple partition clustering which consists in searching for several latent class variables, then allowing several clustering points of view to be revealed by the model. Finally, I have also been interested in more general model-based clustering issues such as the label switching problem, taking into account missing data, or visualizing the output of a mixture. In another part of my research I have been worked on application driven issues. In this scope, I have worked on the usability study of medical devices through the modeling of the discovery matrix modeling thus enabling the manufacturer to access the completeness of the discovery process and evaluate its performances. I have worked on credit scoring through the automation of pre-processing by embedding it in the scoring model estimation. Finally, I have worked on aircraft flight data in order to propose a data driven optimization of the plane trajectory. These different research works have been carried out within the framework of research projects and have led to publications in peer review journals. All along these works, I have participated in the supervision of internships, thesis, post-doctoral students and engineers. In this manuscript I present a synthesis my research works as well as the resulting research projects.Show less >
Language :
Anglais
Collections :
  • Autres travaux scientifiques
Submission date :
2022-01-27T16:12:15Z
Files
Thumbnail
  • HDR_VANDEWALLE_Vincent_.pdf
  • Non spécifié
  • Open access
  • Access the document
Université de Lille

Mentions légales
Université de Lille © 2017