• English
    • français
  • Aide
  •  | 
  • Contact
  •  | 
  • À Propos
  •  | 
  • Ouvrir une session
  • Portail HAL
  •  | 
  • Pages Pro Chercheurs
  • EN
  •  / 
  • FR
Voir le document 
  •   Accueil de LillOA
  • Liste des unités
  • Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL) - UMR 9189
  • Voir le document
  •   Accueil de LillOA
  • Liste des unités
  • Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL) - UMR 9189
  • Voir le document
JavaScript is disabled for your browser. Some features of this site may not work without it.

Bandits on graphs and structures
  • BibTeX
  • CSV
  • Excel
  • RIS

Type de document :
Habilitation à diriger des recherches
Titre :
Bandits on graphs and structures
Titre en anglais :
Bandits on graphs and structures
Auteur(s) :
Valko, Michal [Auteur] refId
Sequential Learning [SEQUEL]
Directeur(s) de thèse :
Aurélien Garivier
Date de soutenance :
2016-06-15
Président du jury :
Nicolas Vayatis (Garant & Examinateur)
Aurélien Garivier (Président & Rapporteur)
Gábor Lugosi (Rapporteur)
Vianney Perchet (Rapporteur)
Nicolò Cesa-Bianchi (Examinateur)
Mark Herbster (Examinateur)
Rémi Munos (Examinateur)
Membre(s) du jury :
Nicolas Vayatis (Garant & Examinateur)
Aurélien Garivier (Président & Rapporteur)
Gábor Lugosi (Rapporteur)
Vianney Perchet (Rapporteur)
Nicolò Cesa-Bianchi (Examinateur)
Mark Herbster (Examinateur)
Rémi Munos (Examinateur)
Organisme de délivrance :
École normale supérieure de Cachan - ENS Cachan
Mot(s)-clé(s) :
apprentissage statistique
Mot(s)-clé(s) en anglais :
machine learning
sequential decision-making
bandits
graphs
structured learning
Discipline(s) HAL :
Statistiques [stat]/Machine Learning [stat.ML]
Résumé en anglais : [en]
We investigate the structural properties of certain sequential decision-making problems with limited feedback (bandits) in order to bring the known algorithmic solutions closer to a practical use. In the first part, we put ...
Lire la suite >
We investigate the structural properties of certain sequential decision-making problems with limited feedback (bandits) in order to bring the known algorithmic solutions closer to a practical use. In the first part, we put a special emphasis on structures that can be represented as graphs on actions, in the second part we study the large action spaces that can be of exponential size in the number of base actions or even infinite. We show how to take advantage of structures over the actions and (provably) learn faster.Lire moins >
Langue :
Anglais
Collections :
  • Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL) - UMR 9189
Source :
Harvested from HAL
Fichiers
Thumbnail
  • https://hal.inria.fr/tel-01359757/document
  • Accès libre
  • Accéder au document
Thumbnail
  • https://hal.inria.fr/tel-01359757/document
  • Accès libre
  • Accéder au document
Thumbnail
  • https://hal.inria.fr/tel-01359757/document
  • Accès libre
  • Accéder au document
Thumbnail
  • document
  • Accès libre
  • Accéder au document
Thumbnail
  • valko2016bandits.pdf
  • Accès libre
  • Accéder au document
Université de Lille

Mentions légales
Université de Lille © 2017