Gaussian Parsimonious Clustering Models ...
Type de document :
Article dans une revue scientifique
URL permanente :
Titre :
Gaussian Parsimonious Clustering Models Scale Invariant and Stable by Projection
Auteur(s) :
Titre de la revue :
Statistics and Computing
Nom court de la revue :
Stat. comput.
Éditeur :
Springer Verlag (Germany)
Date de publication :
2013-12-02
ISSN :
0960-3174
Mot(s)-clé(s) :
Correlation
EM algorithm
Faithful projection
Maximum-Likelihood
Standard deviation
Unit independence
EM algorithm
Faithful projection
Maximum-Likelihood
Standard deviation
Unit independence
Discipline(s) HAL :
Statistiques [stat]/Méthodologie [stat.ME]
Résumé :
La classification à base de modèles de mélanges gaussiens est maintenant un outil standard pour déterminer une hypothétique structure cachée dans un jeu de données continues. Pourtant de nombreux modèles parcimonieux usuels, ...
Lire la suite >La classification à base de modèles de mélanges gaussiens est maintenant un outil standard pour déterminer une hypothétique structure cachée dans un jeu de données continues. Pourtant de nombreux modèles parcimonieux usuels, malgré leur interprétation géométrique conviviale, souffrent de défauts majeurs comme la dépendance aux unités de mesure ou encore la violation des contraintes par projection. Dans ce travail, nous présentons une nouvelle famille de modèles gaussiens parcimonieux reposant sur une décomposition variance-corrélation des matrices de covariance. Ces nouveaux modèles sont stables par projection sur les plans canoniques et, par conséquent, fidèlement représentables en faible dimension. Ils sont aussi indépendants des unités de mesure des données, ce qui signifie que ce choix parfois arbitraire n'a aucune conséquence sur la sélection de modèle reposant sur des critères à base de vraisemblance. Nous mettons en évidence toutes ces propriétés de stabilité par une représentation géométrique spécifique à chacun des modèles. Un algorithme GEM est aussi donné en détail pour estimer leurs paramètres. Nous comparons enfin nos modèles stables et les modèles géométriques standards sur des données réelles issues de la biologie et de la géologie.Lire moins >
Lire la suite >La classification à base de modèles de mélanges gaussiens est maintenant un outil standard pour déterminer une hypothétique structure cachée dans un jeu de données continues. Pourtant de nombreux modèles parcimonieux usuels, malgré leur interprétation géométrique conviviale, souffrent de défauts majeurs comme la dépendance aux unités de mesure ou encore la violation des contraintes par projection. Dans ce travail, nous présentons une nouvelle famille de modèles gaussiens parcimonieux reposant sur une décomposition variance-corrélation des matrices de covariance. Ces nouveaux modèles sont stables par projection sur les plans canoniques et, par conséquent, fidèlement représentables en faible dimension. Ils sont aussi indépendants des unités de mesure des données, ce qui signifie que ce choix parfois arbitraire n'a aucune conséquence sur la sélection de modèle reposant sur des critères à base de vraisemblance. Nous mettons en évidence toutes ces propriétés de stabilité par une représentation géométrique spécifique à chacun des modèles. Un algorithme GEM est aussi donné en détail pour estimer leurs paramètres. Nous comparons enfin nos modèles stables et les modèles géométriques standards sur des données réelles issues de la biologie et de la géologie.Lire moins >
Résumé en anglais : [en]
Gaussian mixture model-based clustering is now a standard tool to determine an hypothetical underlying structure into continuous data. However many usual parsimonious models, despite their appealing geometrical interpretation, ...
Lire la suite >Gaussian mixture model-based clustering is now a standard tool to determine an hypothetical underlying structure into continuous data. However many usual parsimonious models, despite their appealing geometrical interpretation, suffer from major drawbacks as scale dependence or unsustainability of the constraints by projection. In this work we present a new family of parsimonious Gaussian models based on a variance-correlation decomposition of the covariance matrices. These new models are stable by projection into the canonical planes and, so, faithfully representable in low dimension. They are also stable by modification of the measurement units of the data and such a modification does not change the model selection based on likelihood criteria. We highlight all these stability properties by a specific geometrical representation of each model. A detailed GEM algorithm is also provided for every model inference. Then, on biological and geological data, we compare our stable models to standard geometrical ones.Lire moins >
Lire la suite >Gaussian mixture model-based clustering is now a standard tool to determine an hypothetical underlying structure into continuous data. However many usual parsimonious models, despite their appealing geometrical interpretation, suffer from major drawbacks as scale dependence or unsustainability of the constraints by projection. In this work we present a new family of parsimonious Gaussian models based on a variance-correlation decomposition of the covariance matrices. These new models are stable by projection into the canonical planes and, so, faithfully representable in low dimension. They are also stable by modification of the measurement units of the data and such a modification does not change the model selection based on likelihood criteria. We highlight all these stability properties by a specific geometrical representation of each model. A detailed GEM algorithm is also provided for every model inference. Then, on biological and geological data, we compare our stable models to standard geometrical ones.Lire moins >
Langue :
Anglais
Audience :
Internationale
Vulgarisation :
Non
Date de dépôt :
2020-06-08T14:11:23Z
2020-06-10T12:06:57Z
2020-06-10T12:06:57Z
Fichiers
- documen
- Accès libre
- Accéder au document