Analyse non asymptotique d'un test séquentiel ...
Type de document :
Communication dans un congrès avec actes
Titre :
Analyse non asymptotique d'un test séquentiel de détection de rupture et application aux bandits non stationnaires
Auteur(s) :
Besson, Lilian [Auteur]
CentraleSupélec
Institut d'Électronique et des Technologies du numéRique [IETR]
Sequential Learning [SEQUEL]
Signal, Communication et Electronique Embarquée [SCEE]
SUPELEC-Campus Rennes
Kaufmann, Emilie [Auteur]
Centre National de la Recherche Scientifique [CNRS]
Sequential Learning [SEQUEL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
CentraleSupélec
Institut d'Électronique et des Technologies du numéRique [IETR]
Sequential Learning [SEQUEL]
Signal, Communication et Electronique Embarquée [SCEE]
SUPELEC-Campus Rennes
Kaufmann, Emilie [Auteur]
Centre National de la Recherche Scientifique [CNRS]
Sequential Learning [SEQUEL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Titre de la manifestation scientifique :
GRETSI 2019 - XXVIIème Colloque francophone de traitement du signal et des images
Ville :
Lille
Pays :
France
Date de début de la manifestation scientifique :
2019-08-26
Discipline(s) HAL :
Informatique [cs]/Apprentissage [cs.LG]
Mathématiques [math]/Statistiques [math.ST]
Statistiques [stat]/Machine Learning [stat.ML]
Mathématiques [math]/Statistiques [math.ST]
Statistiques [stat]/Machine Learning [stat.ML]
Résumé :
Nous étudions un test pour la détection séquentielle de rupture, basé sur le rapport de vraisemblance généralisé (GLR) et qui s'exprime en fonction de l'entropie relative binaire. Il s'applique à la détection de rupture ...
Lire la suite >Nous étudions un test pour la détection séquentielle de rupture, basé sur le rapport de vraisemblance généralisé (GLR) et qui s'exprime en fonction de l'entropie relative binaire. Il s'applique à la détection de rupture sur la moyenne d'une distribution bornée, et nous obtenons un contrôle non-asymptotique de sa probabilité de fausse alarme et de son délai de détection. Nous expliquons son utilisation pour la prise de décision séquentielle en proposant la stratégie de bandit GLR-klUCB, efficace dans des modèles de bandit stationnaires par morceaux.Lire moins >
Lire la suite >Nous étudions un test pour la détection séquentielle de rupture, basé sur le rapport de vraisemblance généralisé (GLR) et qui s'exprime en fonction de l'entropie relative binaire. Il s'applique à la détection de rupture sur la moyenne d'une distribution bornée, et nous obtenons un contrôle non-asymptotique de sa probabilité de fausse alarme et de son délai de détection. Nous expliquons son utilisation pour la prise de décision séquentielle en proposant la stratégie de bandit GLR-klUCB, efficace dans des modèles de bandit stationnaires par morceaux.Lire moins >
Résumé en anglais : [en]
We study a strategy for online change-point detection based on generalized likelihood ratios (GLR) and that can be expressed with the binary relative entropy. This test is used to detect a change in the mean of a bounded ...
Lire la suite >We study a strategy for online change-point detection based on generalized likelihood ratios (GLR) and that can be expressed with the binary relative entropy. This test is used to detect a change in the mean of a bounded distribution, and we propose a non-asymptotic control of its false alarm probability and detection delay. We then explain how it can be useful for sequential decision making by proposing the GLR-klUCB bandit strategy, which is efficient in piece-wise stationary multi-armed bandit models.Lire moins >
Lire la suite >We study a strategy for online change-point detection based on generalized likelihood ratios (GLR) and that can be expressed with the binary relative entropy. This test is used to detect a change in the mean of a bounded distribution, and we propose a non-asymptotic control of its false alarm probability and detection delay. We then explain how it can be useful for sequential decision making by proposing the GLR-klUCB bandit strategy, which is efficient in piece-wise stationary multi-armed bandit models.Lire moins >
Langue :
Français
Comité de lecture :
Oui
Audience :
Nationale
Vulgarisation :
Non
Collections :
Source :
Fichiers
- https://hal.inria.fr/hal-02152243/document
- Accès libre
- Accéder au document
- https://hal.inria.fr/hal-02152243/document
- Accès libre
- Accéder au document
- https://hal.inria.fr/hal-02152243/document
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- GRESTI__2019__Paper__Lilian_Besson__03-19.pdf
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- GRESTI__2019__Paper__Lilian_Besson__03-19.pdf
- Accès libre
- Accéder au document