JEUX DE BANDITS ET FONDATIONS DU CLUSTERING
Type de document :
Thèse
Titre :
JEUX DE BANDITS ET FONDATIONS DU CLUSTERING
Titre en anglais :
Bandits Games and Clustering Foundations
Auteur(s) :
Bubeck, Sébastien [Auteur]
Laboratoire d'Informatique Fondamentale de Lille [LIFL]
Sequential Learning [SEQUEL]
Laboratoire Paul Painlevé - UMR 8524 [LPP]
Laboratoire d'Informatique Fondamentale de Lille [LIFL]
Sequential Learning [SEQUEL]
Laboratoire Paul Painlevé - UMR 8524 [LPP]
Directeur(s) de thèse :
Rémi Munos
Date de soutenance :
2010-06-10
Président du jury :
Mme. Cristina BUTUCEA Universit e Lille 1 Co-Directrice
M. Olivier CATONI CNRS et ENS Rapporteur
M. Nicol o CESA-BIANCHI Universit a degli Studi di Milano Rapporteur
M. Pascal MASSART Universit e Paris-Sud Examinateur
M. Eric MOULINES T el ecom ParisTech Examinateur
M. R emi MUNOS INRIA Lille Directeur
M. Olivier CATONI CNRS et ENS Rapporteur
M. Nicol o CESA-BIANCHI Universit a degli Studi di Milano Rapporteur
M. Pascal MASSART Universit e Paris-Sud Examinateur
M. Eric MOULINES T el ecom ParisTech Examinateur
M. R emi MUNOS INRIA Lille Directeur
Membre(s) du jury :
Mme. Cristina BUTUCEA Universit e Lille 1 Co-Directrice
M. Olivier CATONI CNRS et ENS Rapporteur
M. Nicol o CESA-BIANCHI Universit a degli Studi di Milano Rapporteur
M. Pascal MASSART Universit e Paris-Sud Examinateur
M. Eric MOULINES T el ecom ParisTech Examinateur
M. R emi MUNOS INRIA Lille Directeur
M. Olivier CATONI CNRS et ENS Rapporteur
M. Nicol o CESA-BIANCHI Universit a degli Studi di Milano Rapporteur
M. Pascal MASSART Universit e Paris-Sud Examinateur
M. Eric MOULINES T el ecom ParisTech Examinateur
M. R emi MUNOS INRIA Lille Directeur
Organisme de délivrance :
Université des Sciences et Technologie de Lille - Lille I
École doctorale :
Ecole Doctoral Sciences pour l'Ingénieur
Mot(s)-clé(s) :
online learning
optimisation stochastique
jeux de bandits
apprentissage séquentiel
regret minimax
prédiction avec information incomplète
bandits avec infinité d'actions
regret non cumulé
exploration efficace
clustering
consistance
stabilité
optimisation stochastique
jeux de bandits
apprentissage séquentiel
regret minimax
prédiction avec information incomplète
bandits avec infinité d'actions
regret non cumulé
exploration efficace
clustering
consistance
stabilité
Mot(s)-clé(s) en anglais :
stochastic optimization
bandits games
sequential learning
minimax regret
prediction with limited feedback
bandits with infinitely many arms
non-cumulative regret
efficient exploration
consistency
stability.
bandits games
sequential learning
minimax regret
prediction with limited feedback
bandits with infinitely many arms
non-cumulative regret
efficient exploration
consistency
stability.
Discipline(s) HAL :
Mathématiques [math]/Statistiques [math.ST]
Statistiques [stat]/Théorie [stat.TH]
Statistiques [stat]/Théorie [stat.TH]
Résumé :
Ce travail de thèse s'inscrit dans le domaine du machine learning et concerne plus particulièrement les sous-catégories de l'optimisation stochastique, du online learning et du clustering. Ces sous-domaines existent depuis ...
Lire la suite >Ce travail de thèse s'inscrit dans le domaine du machine learning et concerne plus particulièrement les sous-catégories de l'optimisation stochastique, du online learning et du clustering. Ces sous-domaines existent depuis plusieurs décennies mais ils ont tous reçu un éclairage différent au cours de ces dernières années. Notamment, les jeux de bandits offrent aujourd'hui un cadre commun pour l'optimisation stochastique et l'online learning. Ce point de vue conduit a de nombreuses extensions du jeu de base. C'est sur l'étude mathématique de ces jeux que se concentre la première partie de cette thèse. La seconde partie est quant à elle dédiée au clustering et plus particulièrement à deux notions importantes: la consistance asymptotique des algorithmes et la stabilité comme méthode de sélection de modèles.Lire moins >
Lire la suite >Ce travail de thèse s'inscrit dans le domaine du machine learning et concerne plus particulièrement les sous-catégories de l'optimisation stochastique, du online learning et du clustering. Ces sous-domaines existent depuis plusieurs décennies mais ils ont tous reçu un éclairage différent au cours de ces dernières années. Notamment, les jeux de bandits offrent aujourd'hui un cadre commun pour l'optimisation stochastique et l'online learning. Ce point de vue conduit a de nombreuses extensions du jeu de base. C'est sur l'étude mathématique de ces jeux que se concentre la première partie de cette thèse. La seconde partie est quant à elle dédiée au clustering et plus particulièrement à deux notions importantes: la consistance asymptotique des algorithmes et la stabilité comme méthode de sélection de modèles.Lire moins >
Résumé en anglais : [en]
This thesis takes place within the machine learning theory. In particular it focuses on three sub-domains, stochastic optimization, online learning and clustering. These subjects exist for decades, but all have been recently ...
Lire la suite >This thesis takes place within the machine learning theory. In particular it focuses on three sub-domains, stochastic optimization, online learning and clustering. These subjects exist for decades, but all have been recently studied under a new perspective. For instance, bandits games now offer a unified framework for stochastic optimization and online learning. This point of view results in many new extensions of the basic game. In the first part of this thesis, we focus on the mathematical study of these extensions (as well as the classical game). On the other hand, in the second part we discuss two important theoretical concepts for clustering, namely the consistency of algorithms and the stability as a tool for model selection.Lire moins >
Lire la suite >This thesis takes place within the machine learning theory. In particular it focuses on three sub-domains, stochastic optimization, online learning and clustering. These subjects exist for decades, but all have been recently studied under a new perspective. For instance, bandits games now offer a unified framework for stochastic optimization and online learning. This point of view results in many new extensions of the basic game. In the first part of this thesis, we focus on the mathematical study of these extensions (as well as the classical game). On the other hand, in the second part we discuss two important theoretical concepts for clustering, namely the consistency of algorithms and the stability as a tool for model selection.Lire moins >
Langue :
Anglais
Collections :
Source :
Fichiers
- document
- Accès libre
- Accéder au document
- thesis_Bubeck.pdf
- Accès libre
- Accéder au document