Contribution à l'apprentissage statistique à base de modèles génératifs pour données complexes.
Contribution to statistical learning of complex data using generative models
Type de document :
Habilitation à diriger des recherches
URL permanente :
Titre :
Contribution à l'apprentissage statistique à base de modèles génératifs pour données complexes.
Contribution to statistical learning of complex data using generative models
Contribution to statistical learning of complex data using generative models
Auteur(s) :
Jacques, Julien [Auteur]
Date de publication :
2012-11-28
Mot(s)-clé(s) :
Statistical learning
Transfer learning
Generative model
Ranking data
Ordinal data
Functional data
High dimensional problem
Clustering
Apprentissage statistique
Apprentissage adaptatif
Modèles génératifs
Données de rang
Données ordinales
Données fonctionnelles
Grande dimension
Classification automatique
Transfer learning
Generative model
Ranking data
Ordinal data
Functional data
High dimensional problem
Clustering
Apprentissage statistique
Apprentissage adaptatif
Modèles génératifs
Données de rang
Données ordinales
Données fonctionnelles
Grande dimension
Classification automatique
Discipline(s) HAL :
Mathématiques [math]/Statistiques [math.ST]
Résumé :
Ce mémoire synthétise les activités de recherche que j'ai menées de 2005 à 2012, sur la thématique de l'apprentissage statistique des données complexes, abordée par le biais de modèles probabilistes paramétriques génératifs. ...
Lire la suite >Ce mémoire synthétise les activités de recherche que j'ai menées de 2005 à 2012, sur la thématique de l'apprentissage statistique des données complexes, abordée par le biais de modèles probabilistes paramétriques génératifs. Plusieurs types de données complexes sont considérées. Les données issues de populations différentes ont été abordées en proposant des modèles de lien paramétriques entre populations, permettant d'adapter les modèles statistiques d'une population vers l'autre, en évitant une lourde collecte de nouvelles données. Les données de rang, définissant un classement d'objets selon un ordre de préférence, les données ordinales, qui sont des données qualitatives ayant des modalités ordonnées, et les données fonctionnelles, où l'observation statistique consiste en une ou plusieurs courbes, ont également été étudies. Pour ces trois types de données, des modèles génératifs probabilistes ont été définis et utilisés en classification automatique de données multivariées. Enfin les données de grande dimension, que l'on rencontre lorsque le nombre de variables du problème dépasse celui des observations, ont été étudiées dans un cadre de régression. Deux approches, fruits de deux thèses de doctorat que je co-encadre, sont proposés: l'une utilisant des algorithmes d'optimisation combinatoire pour explorer de façon efficace l'espace des variables, et l'autre définissant un modèle de régression regroupant ensemble les variables ayant un effet similaire.Lire moins >
Lire la suite >Ce mémoire synthétise les activités de recherche que j'ai menées de 2005 à 2012, sur la thématique de l'apprentissage statistique des données complexes, abordée par le biais de modèles probabilistes paramétriques génératifs. Plusieurs types de données complexes sont considérées. Les données issues de populations différentes ont été abordées en proposant des modèles de lien paramétriques entre populations, permettant d'adapter les modèles statistiques d'une population vers l'autre, en évitant une lourde collecte de nouvelles données. Les données de rang, définissant un classement d'objets selon un ordre de préférence, les données ordinales, qui sont des données qualitatives ayant des modalités ordonnées, et les données fonctionnelles, où l'observation statistique consiste en une ou plusieurs courbes, ont également été étudies. Pour ces trois types de données, des modèles génératifs probabilistes ont été définis et utilisés en classification automatique de données multivariées. Enfin les données de grande dimension, que l'on rencontre lorsque le nombre de variables du problème dépasse celui des observations, ont été étudiées dans un cadre de régression. Deux approches, fruits de deux thèses de doctorat que je co-encadre, sont proposés: l'une utilisant des algorithmes d'optimisation combinatoire pour explorer de façon efficace l'espace des variables, et l'autre définissant un modèle de régression regroupant ensemble les variables ayant un effet similaire.Lire moins >
Résumé en anglais : [en]
This manuscript presents my research activities, which mainly focus on designing parametric, parsimonious and meaningful generative models for complex data. Several kinds of complex data have been studied. Data sampled ...
Lire la suite >This manuscript presents my research activities, which mainly focus on designing parametric, parsimonious and meaningful generative models for complex data. Several kinds of complex data have been studied. Data sampled from different populations (transfer learning) has been addressed by designing parametric models for the link between the different populations. Thus, statistical models can be adapted from one population to another one by sparing a large collect of new data. Ranking data, which results from ranking of objects by a judge according to a preference order, ordinal data, which are categorical data with ordered categories, and functional data, in which the statistical unit consists of one or several curves, have also been studied. For this three kinds of complex data, generative models have been developed and used for the clustering of multidimensional data. The last kind of complex data, high dimensional data, has been studied in a regression context. In this domain, two approaches are proposed by two Ph.D. students I co-supervise\\string: the first one uses combinatorial optimization algorithms in order to efficiently explore the feature space and the second one defines a regression model in which the variables having a similar effect on the output are grouped together.Lire moins >
Lire la suite >This manuscript presents my research activities, which mainly focus on designing parametric, parsimonious and meaningful generative models for complex data. Several kinds of complex data have been studied. Data sampled from different populations (transfer learning) has been addressed by designing parametric models for the link between the different populations. Thus, statistical models can be adapted from one population to another one by sparing a large collect of new data. Ranking data, which results from ranking of objects by a judge according to a preference order, ordinal data, which are categorical data with ordered categories, and functional data, in which the statistical unit consists of one or several curves, have also been studied. For this three kinds of complex data, generative models have been developed and used for the clustering of multidimensional data. The last kind of complex data, high dimensional data, has been studied in a regression context. In this domain, two approaches are proposed by two Ph.D. students I co-supervise\\string: the first one uses combinatorial optimization algorithms in order to efficiently explore the feature space and the second one defines a regression model in which the variables having a similar effect on the output are grouped together.Lire moins >
Langue :
Français
Date de dépôt :
2020-06-08T14:10:18Z