Classification simultanée à base de mélanges ...
Document type :
Communication dans un congrès avec actes
Title :
Classification simultanée à base de mélanges gaussiens pour des échantillons d'origines multiples
Author(s) :
Lourme, Alexandre [Auteur]
Université de Lille, Sciences et Technologies
Biernacki, Christophe [Auteur]
Laboratoire Paul Painlevé - UMR 8524 [LPP]
Université de Lille, Sciences et Technologies
Biernacki, Christophe [Auteur]
Laboratoire Paul Painlevé - UMR 8524 [LPP]
Conference title :
41èmes Journées de Statistique, SFdS, Bordeaux
City :
Bordeaux, France
Country :
France
Start date of the conference :
2009
Publication date :
2009
HAL domain(s) :
Mathématiques [math]/Statistiques [math.ST]
French abstract :
Habituellement, quand on cherche à partitionner des échantillons provenant de populations différentes, on met en oeuvre plusieurs procédures de classification indépendantes. Mais lorsque les échantillons sont décrits par ...
Show more >Habituellement, quand on cherche à partitionner des échantillons provenant de populations différentes, on met en oeuvre plusieurs procédures de classification indépendantes. Mais lorsque les échantillons sont décrits par les mêmes variables et que la partition a la même signification d'un échantillon à l'autre, nous proposons d'appliquer une procédure dite de classification simultanée. Il s'agit, dans un contexte de mélanges gaussiens, d'établir, sous des hypothèses simples et réalistes, un lien stochastique linéaire entre les composantes normales des populations, ce qui permet d'estimer simultanément le paramètre de tous les mélanges afin de classer les individus des différents échantillons. En nous inspirant de modèles parcimonieux de mélanges gaussiens, classiques, nous proposons plusieurs modèles de contraintes portant à la fois sur le paramètre des mélanges et sur le lien linéaire entre les populations. Le critère BIC permet de choisir un de ces modèles, mais aussi de comparer les deux méthodes de classification, indépendante et simultanée. Grâce à un exemple biologique, dans lequel des échantillons d'oiseaux provenant de trois espèces différentes doivent être classés selon leur sexe, nous observons que la classification simultanée donne des résultats prometteurs.Show less >
Show more >Habituellement, quand on cherche à partitionner des échantillons provenant de populations différentes, on met en oeuvre plusieurs procédures de classification indépendantes. Mais lorsque les échantillons sont décrits par les mêmes variables et que la partition a la même signification d'un échantillon à l'autre, nous proposons d'appliquer une procédure dite de classification simultanée. Il s'agit, dans un contexte de mélanges gaussiens, d'établir, sous des hypothèses simples et réalistes, un lien stochastique linéaire entre les composantes normales des populations, ce qui permet d'estimer simultanément le paramètre de tous les mélanges afin de classer les individus des différents échantillons. En nous inspirant de modèles parcimonieux de mélanges gaussiens, classiques, nous proposons plusieurs modèles de contraintes portant à la fois sur le paramètre des mélanges et sur le lien linéaire entre les populations. Le critère BIC permet de choisir un de ces modèles, mais aussi de comparer les deux méthodes de classification, indépendante et simultanée. Grâce à un exemple biologique, dans lequel des échantillons d'oiseaux provenant de trois espèces différentes doivent être classés selon leur sexe, nous observons que la classification simultanée donne des résultats prometteurs.Show less >
Language :
Français
Peer reviewed article :
Oui
Audience :
Internationale
Popular science :
Non
Collections :
Source :
Files
- document
- Open access
- Access the document
- p102.pdf
- Open access
- Access the document