JEUX DE BANDITS ET FONDATIONS DU CLUSTERING
Document type :
Thèse
Title :
JEUX DE BANDITS ET FONDATIONS DU CLUSTERING
English title :
Bandits Games and Clustering Foundations
Author(s) :
Bubeck, Sébastien [Auteur]
Laboratoire d'Informatique Fondamentale de Lille [LIFL]
Sequential Learning [SEQUEL]
Laboratoire Paul Painlevé - UMR 8524 [LPP]
Laboratoire d'Informatique Fondamentale de Lille [LIFL]
Sequential Learning [SEQUEL]
Laboratoire Paul Painlevé - UMR 8524 [LPP]
Thesis director(s) :
Rémi Munos
Defence date :
2010-06-10
Jury president :
Mme. Cristina BUTUCEA Universit e Lille 1 Co-Directrice
M. Olivier CATONI CNRS et ENS Rapporteur
M. Nicol o CESA-BIANCHI Universit a degli Studi di Milano Rapporteur
M. Pascal MASSART Universit e Paris-Sud Examinateur
M. Eric MOULINES T el ecom ParisTech Examinateur
M. R emi MUNOS INRIA Lille Directeur
M. Olivier CATONI CNRS et ENS Rapporteur
M. Nicol o CESA-BIANCHI Universit a degli Studi di Milano Rapporteur
M. Pascal MASSART Universit e Paris-Sud Examinateur
M. Eric MOULINES T el ecom ParisTech Examinateur
M. R emi MUNOS INRIA Lille Directeur
Jury member(s) :
Mme. Cristina BUTUCEA Universit e Lille 1 Co-Directrice
M. Olivier CATONI CNRS et ENS Rapporteur
M. Nicol o CESA-BIANCHI Universit a degli Studi di Milano Rapporteur
M. Pascal MASSART Universit e Paris-Sud Examinateur
M. Eric MOULINES T el ecom ParisTech Examinateur
M. R emi MUNOS INRIA Lille Directeur
M. Olivier CATONI CNRS et ENS Rapporteur
M. Nicol o CESA-BIANCHI Universit a degli Studi di Milano Rapporteur
M. Pascal MASSART Universit e Paris-Sud Examinateur
M. Eric MOULINES T el ecom ParisTech Examinateur
M. R emi MUNOS INRIA Lille Directeur
Accredited body :
Université des Sciences et Technologie de Lille - Lille I
Doctoral school :
Ecole Doctoral Sciences pour l'Ingénieur
Keyword(s) :
online learning
optimisation stochastique
jeux de bandits
apprentissage séquentiel
regret minimax
prédiction avec information incomplète
bandits avec infinité d'actions
regret non cumulé
exploration efficace
clustering
consistance
stabilité
optimisation stochastique
jeux de bandits
apprentissage séquentiel
regret minimax
prédiction avec information incomplète
bandits avec infinité d'actions
regret non cumulé
exploration efficace
clustering
consistance
stabilité
English keyword(s) :
stochastic optimization
bandits games
sequential learning
minimax regret
prediction with limited feedback
bandits with infinitely many arms
non-cumulative regret
efficient exploration
consistency
stability.
bandits games
sequential learning
minimax regret
prediction with limited feedback
bandits with infinitely many arms
non-cumulative regret
efficient exploration
consistency
stability.
HAL domain(s) :
Mathématiques [math]/Statistiques [math.ST]
Statistiques [stat]/Théorie [stat.TH]
Statistiques [stat]/Théorie [stat.TH]
French abstract :
Ce travail de thèse s'inscrit dans le domaine du machine learning et concerne plus particulièrement les sous-catégories de l'optimisation stochastique, du online learning et du clustering. Ces sous-domaines existent depuis ...
Show more >Ce travail de thèse s'inscrit dans le domaine du machine learning et concerne plus particulièrement les sous-catégories de l'optimisation stochastique, du online learning et du clustering. Ces sous-domaines existent depuis plusieurs décennies mais ils ont tous reçu un éclairage différent au cours de ces dernières années. Notamment, les jeux de bandits offrent aujourd'hui un cadre commun pour l'optimisation stochastique et l'online learning. Ce point de vue conduit a de nombreuses extensions du jeu de base. C'est sur l'étude mathématique de ces jeux que se concentre la première partie de cette thèse. La seconde partie est quant à elle dédiée au clustering et plus particulièrement à deux notions importantes: la consistance asymptotique des algorithmes et la stabilité comme méthode de sélection de modèles.Show less >
Show more >Ce travail de thèse s'inscrit dans le domaine du machine learning et concerne plus particulièrement les sous-catégories de l'optimisation stochastique, du online learning et du clustering. Ces sous-domaines existent depuis plusieurs décennies mais ils ont tous reçu un éclairage différent au cours de ces dernières années. Notamment, les jeux de bandits offrent aujourd'hui un cadre commun pour l'optimisation stochastique et l'online learning. Ce point de vue conduit a de nombreuses extensions du jeu de base. C'est sur l'étude mathématique de ces jeux que se concentre la première partie de cette thèse. La seconde partie est quant à elle dédiée au clustering et plus particulièrement à deux notions importantes: la consistance asymptotique des algorithmes et la stabilité comme méthode de sélection de modèles.Show less >
English abstract : [en]
This thesis takes place within the machine learning theory. In particular it focuses on three sub-domains, stochastic optimization, online learning and clustering. These subjects exist for decades, but all have been recently ...
Show more >This thesis takes place within the machine learning theory. In particular it focuses on three sub-domains, stochastic optimization, online learning and clustering. These subjects exist for decades, but all have been recently studied under a new perspective. For instance, bandits games now offer a unified framework for stochastic optimization and online learning. This point of view results in many new extensions of the basic game. In the first part of this thesis, we focus on the mathematical study of these extensions (as well as the classical game). On the other hand, in the second part we discuss two important theoretical concepts for clustering, namely the consistency of algorithms and the stability as a tool for model selection.Show less >
Show more >This thesis takes place within the machine learning theory. In particular it focuses on three sub-domains, stochastic optimization, online learning and clustering. These subjects exist for decades, but all have been recently studied under a new perspective. For instance, bandits games now offer a unified framework for stochastic optimization and online learning. This point of view results in many new extensions of the basic game. In the first part of this thesis, we focus on the mathematical study of these extensions (as well as the classical game). On the other hand, in the second part we discuss two important theoretical concepts for clustering, namely the consistency of algorithms and the stability as a tool for model selection.Show less >
Language :
Anglais
Collections :
Source :
Files
- https://tel.archives-ouvertes.fr/tel-00845565/document
- Open access
- Access the document
- https://tel.archives-ouvertes.fr/tel-00845565/document
- Open access
- Access the document
- https://tel.archives-ouvertes.fr/tel-00845565/document
- Open access
- Access the document
- https://tel.archives-ouvertes.fr/tel-00845565/document
- Open access
- Access the document
- document
- Open access
- Access the document
- thesis_Bubeck.pdf
- Open access
- Access the document
- document
- Open access
- Access the document
- thesis_Bubeck.pdf
- Open access
- Access the document