Top-m identification for linear bandits
Type de document :
Communication dans un congrès avec actes
Titre :
Top-m identification for linear bandits
Auteur(s) :
Réda, Clémence [Auteur]
Maladies neurodéveloppementales et neurovasculaires [NeuroDiderot (UMR_S_1141 / U1141)]
Kaufmann, Emilie [Auteur]
Scool [Scool]
Centrale Lille
Centre National de la Recherche Scientifique [CNRS]
Delahaye-Duriez, Andrée [Auteur]
Maladies neurodéveloppementales et neurovasculaires [NeuroDiderot (UMR_S_1141 / U1141)]
Hôpital Jean Verdier [AP-HP]
Université Sorbonne Paris Nord
Maladies neurodéveloppementales et neurovasculaires [NeuroDiderot (UMR_S_1141 / U1141)]
Kaufmann, Emilie [Auteur]
Scool [Scool]
Centrale Lille
Centre National de la Recherche Scientifique [CNRS]
Delahaye-Duriez, Andrée [Auteur]
Maladies neurodéveloppementales et neurovasculaires [NeuroDiderot (UMR_S_1141 / U1141)]
Hôpital Jean Verdier [AP-HP]
Université Sorbonne Paris Nord
Titre de la manifestation scientifique :
Proceedings of the 24th International Conference on Artificial Intelligence and Statistics (AISTATS)
Ville :
Virtual
Pays :
Etats-Unis d'Amérique
Date de début de la manifestation scientifique :
2021
Lieu de publication :
San Diego, California, USA
Date de publication :
2021
Mot(s)-clé(s) en anglais :
Multi-armed bandit
Best arm identification
Adaptive sampling
Drug repurposing
Fixed-confidence setting
Best arm identification
Adaptive sampling
Drug repurposing
Fixed-confidence setting
Discipline(s) HAL :
Informatique [cs]/Intelligence artificielle [cs.AI]
Informatique [cs]/Bio-informatique [q-bio.QM]
Informatique [cs]/Apprentissage [cs.LG]
Mathématiques [math]/Statistiques [math.ST]
Informatique [cs]/Bio-informatique [q-bio.QM]
Informatique [cs]/Apprentissage [cs.LG]
Mathématiques [math]/Statistiques [math.ST]
Résumé en anglais : [en]
Motivated by an application to drug repurposing, we propose the first algorithms to tackle the identification of the m ≥ 1 arms with largest means in a linear bandit model, in the fixed-confidence setting. These algorithms ...
Lire la suite >Motivated by an application to drug repurposing, we propose the first algorithms to tackle the identification of the m ≥ 1 arms with largest means in a linear bandit model, in the fixed-confidence setting. These algorithms belong to the generic family of Gap-Index Focused Algorithms (GIFA) that we introduce for Top-m identification in linear bandits. We propose a unified analysis of these algorithms, which shows how the use of features might decrease the sample complexity. We further validate these algorithms empirically on simulated data and on a simple drug repurposing task.Lire moins >
Lire la suite >Motivated by an application to drug repurposing, we propose the first algorithms to tackle the identification of the m ≥ 1 arms with largest means in a linear bandit model, in the fixed-confidence setting. These algorithms belong to the generic family of Gap-Index Focused Algorithms (GIFA) that we introduce for Top-m identification in linear bandits. We propose a unified analysis of these algorithms, which shows how the use of features might decrease the sample complexity. We further validate these algorithms empirically on simulated data and on a simple drug repurposing task.Lire moins >
Langue :
Anglais
Comité de lecture :
Oui
Audience :
Internationale
Vulgarisation :
Non
Collections :
Source :
Fichiers
- https://hal.archives-ouvertes.fr/hal-03172145/document
- Accès libre
- Accéder au document
- https://hal.archives-ouvertes.fr/hal-03172145/document
- Accès libre
- Accéder au document
- https://hal.archives-ouvertes.fr/hal-03172145/document
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- reda2021top.pdf
- Accès libre
- Accéder au document