Recherche
Résultats 1-10 de 47
-
Le test du ratio de vraisemblance généralisé (GLRT) rencontre klUCB : un meilleur algorithme pour les bandits stationnaires par morceaux
01-02-2019Pré-publication ou Document de travailtexte intégral -
Optimal Thompson Sampling strategies for support-aware CVaR bandits
ICML 2021 - International Conference on Machine Learning, Virtual Conference, 18-07-2021Autre communication scientifique (congrès sans actes - poster - séminaire...)Communication dans un congrès avec actestexte intégral -
Forced-exploration free Strategies for Unimodal Bandits
Pré-publication ou Document de travailtexte intégral -
Modèles de Bandits Multi-Joueurs Revisités
Algorithmic Learning Theory, Lanzarote, 07-04-2018, 2018Communication dans un congrès avec actestexte intégral -
Agrégation d'algorithmes d'apprentissage pour les bandits multi-bras appliquée à l'accès opportuniste au spectre
IEEE WCNC - IEEE Wireless Communications and Networking Conference, Barcelona, 14-04-2018Communication dans un congrès avec actestexte intégral -
Pure Exploration in Infinitely-Armed Bandit Models with Fixed-Confidence
ALT 2018 - Algorithmic Learning Theory, Lanzarote, 07-04-2018, JMLR Workshop and Conference Proceedings, 07-04-2018Communication dans un congrès avec actestexte intégral -
Monte-Carlo Tree Search by Best Arm Identification
NIPS 2017 - 31st Annual Conference on Neural Information Processing Systems, Long Beach, 04-12-2017, Advances in Neural Information Processing Systems, 12-2017Communication dans un congrès avec actestexte intégral -
A Practical Algorithm for Multiplayer Bandits when Arm Means Vary Among Players
AISTATS 2020 - 23rd International Conference on Artificial Intelligence and Statistics, Palermo, 26-08-2020, 26-08-2020Communication dans un congrès avec actestexte intégral -
Regret Bounds for Learning State Representations in Reinforcement Learning
Conference on Neural Information Processing Systems, Vancouver, 12-2019, Conference on Neural Information Processing SystemsCommunication dans un congrès avec actestexte intégral -
Apprentissage de Bandit Multi-Bras dans les réseaux Internet des Objets: l'apprentissage est utile même dans des cas non-stationnaires
CROWNCOM 2017 - 12th EAI International Conference on Cognitive Radio Oriented Wireless Networks, Lisbon, 20-09-2017, Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering, 2018Communication dans un congrès avec actestexte intégral