• English
    • français
  • Help
  •  | 
  • Contact
  •  | 
  • About
  •  | 
  • Login
  • HAL portal
  •  | 
  • Pages Pro
  • EN
  •  / 
  • FR
View Item 
  •   LillOA Home
  • Liste des unités
  • Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL) - UMR 9189
  • View Item
  •   LillOA Home
  • Liste des unités
  • Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL) - UMR 9189
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Learning the distribution with largest ...
  • BibTeX
  • CSV
  • Excel
  • RIS

Document type :
Article dans une revue scientifique: Article original
DOI :
10.1051/proc/201760114
Title :
Learning the distribution with largest mean: two bandit frameworks
Author(s) :
Kaufmann, Emilie [Auteur] refId
Sequential Learning [SEQUEL]
Garivier, Aurélien [Auteur]
Institut de Mathématiques de Toulouse UMR5219 [IMT]
Journal title :
ESAIM: Proceedings and Surveys
Pages :
114 - 131
Publisher :
EDP Sciences
Publication date :
2017
ISSN :
2267-3059
English keyword(s) :
bandit
ucb
regret minimization
best arm identification
HAL domain(s) :
Mathématiques [math]/Statistiques [math.ST]
French abstract :
Le modèle stochastique dit de bandit à plusieurs bras soulève ces dernières années un grand intérêt dans la communauté de l'apprentissage automatique, du fait notamment de ses applications à l'optimisation de contenu sur ...
Show more >
Le modèle stochastique dit de bandit à plusieurs bras soulève ces dernières années un grand intérêt dans la communauté de l'apprentissage automatique, du fait notamment de ses applications à l'optimisation de contenu sur le web. Cet article présente deux problèmes d'apprentissage séquentiel dans le cadre d'un modèle de bandit qui peuvent être formulés comme la découverte de la distribution ayant la moyenne la plus élevée dans un ensemble de distributions, avec certaines contraintes sur le processus d'apprentissage. Pour ces deux objectifs (minimisation du regret d'une part et identification du meilleur bras d'autre part), nous présentons des algorithmes optimaux, en un sens asymptotique. Nous comparons les stratégies d’échantillonnage employées par ces deux types d'algorithmes ainsi que les quantités caractérisant la complexité de chacun des problèmes.Show less >
English abstract : [en]
Over the past few years, the multi-armed bandit model has become increasingly popular in the machine learning community, partly because of applications including online content optimization. This paper reviews two different ...
Show more >
Over the past few years, the multi-armed bandit model has become increasingly popular in the machine learning community, partly because of applications including online content optimization. This paper reviews two different sequential learning tasks that have been considered in the bandit literature ; they can be formulated as (sequentially) learning which distribution has the highest mean among a set of distributions, with some constraints on the learning process. For both of them (regret minimization and best arm identification) we present recent, asymptotically optimal algorithms. We compare the behaviors of the sampling rule of each algorithm as well as the complexity terms associated to each problem.Show less >
Language :
Anglais
Peer reviewed article :
Oui
Audience :
Internationale
Popular science :
Non
ANR Project :
Statistique Semi-Paramétrique pour l'Allocation Dynamique de Ressources et l'Optimisation
Apprentissage Adaptatif pour le Crowdsourcing Intelligent et l'Accès à l'Information
Collections :
  • Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL) - UMR 9189
Source :
Harvested from HAL
Files
Thumbnail
  • https://hal.archives-ouvertes.fr/hal-01449822v3/document
  • Open access
  • Access the document
Thumbnail
  • http://arxiv.org/pdf/1702.00001
  • Open access
  • Access the document
Thumbnail
  • https://hal.archives-ouvertes.fr/hal-01449822v3/document
  • Open access
  • Access the document
Thumbnail
  • https://hal.archives-ouvertes.fr/hal-01449822v3/document
  • Open access
  • Access the document
Thumbnail
  • https://hal.archives-ouvertes.fr/hal-01449822v3/document
  • Open access
  • Access the document
Thumbnail
  • document
  • Open access
  • Access the document
Thumbnail
  • ESAIM17KG.pdf
  • Open access
  • Access the document
Thumbnail
  • 1702.00001
  • Open access
  • Access the document
Université de Lille

Mentions légales
Accessibilité : non conforme
Université de Lille © 2017