Contrôle du FDR pour la détection d'anomalies ...
Document type :
Pré-publication ou Document de travail
Title :
Contrôle du FDR pour la détection d'anomalies online
Author(s) :
Krönert, Etienne [Auteur]
MOdel for Data Analysis and Learning [MODAL]
Worldline France
Célisse, Alain [Auteur]
Laboratoire Paul Painlevé - UMR 8524 [LPP]
MOdel for Data Analysis and Learning [MODAL]
Statistique, Analyse et Modélisation Multidisciplinaire (SAmos-Marin Mersenne) [SAMM]
Université Paris 1 Panthéon-Sorbonne - UFR Mathématiques & Informatique [UP1 UFR27]
Hattab, Dalila [Auteur]
Worldline France
MOdel for Data Analysis and Learning [MODAL]
Worldline France
Célisse, Alain [Auteur]
Laboratoire Paul Painlevé - UMR 8524 [LPP]
MOdel for Data Analysis and Learning [MODAL]
Statistique, Analyse et Modélisation Multidisciplinaire (SAmos-Marin Mersenne) [SAMM]
Université Paris 1 Panthéon-Sorbonne - UFR Mathématiques & Informatique [UP1 UFR27]
Hattab, Dalila [Auteur]
Worldline France
English keyword(s) :
Anomaly detection
Time series
Multiple testing
Time series
Multiple testing
HAL domain(s) :
Mathématiques [math]/Statistiques [math.ST]
French abstract :
L'objectif de la détection des anomalies est d'identifier les observations générées par un processus différent de celui de référence. Un détecteur d'anomalies précis doit garantir des taux de faux positifs et de faux ...
Show more >L'objectif de la détection des anomalies est d'identifier les observations générées par un processus différent de celui de référence. Un détecteur d'anomalies précis doit garantir des taux de faux positifs et de faux négatifs faibles. Cependant, dans le contexte online, une telle contrainte reste très difficile en raison de l'absence habituelle de contrôle du taux de fausse découverte (FDR). En particulier, le cadre online rend impossible l'utilisation d'approches classiques de tests multiples telles que la procédure Benjamini-Hochberg (BH). Notre stratégie surmonte cette difficulté en exploitant un contrôle local du "FDR modifié" (mFDR). Un ingrédient important de ce contrôle est du cardinal de l'ensemble de calibration utilisé pour calculer les valeurs p empiriques, qui s'avère être un paramètre influent. Il en résulte une nouvelle stratégie de réglage de ce paramètre, qui permet d'obtenir le contrôle souhaité du FDR sur l'ensemble de la série temporelle. La performance statistique de cette stratégie est analysée par des garanties théoriques et son comportement pratique est évalué par des expériences de simulations qui soutiennent nos conclusions.Show less >
Show more >L'objectif de la détection des anomalies est d'identifier les observations générées par un processus différent de celui de référence. Un détecteur d'anomalies précis doit garantir des taux de faux positifs et de faux négatifs faibles. Cependant, dans le contexte online, une telle contrainte reste très difficile en raison de l'absence habituelle de contrôle du taux de fausse découverte (FDR). En particulier, le cadre online rend impossible l'utilisation d'approches classiques de tests multiples telles que la procédure Benjamini-Hochberg (BH). Notre stratégie surmonte cette difficulté en exploitant un contrôle local du "FDR modifié" (mFDR). Un ingrédient important de ce contrôle est du cardinal de l'ensemble de calibration utilisé pour calculer les valeurs p empiriques, qui s'avère être un paramètre influent. Il en résulte une nouvelle stratégie de réglage de ce paramètre, qui permet d'obtenir le contrôle souhaité du FDR sur l'ensemble de la série temporelle. La performance statistique de cette stratégie est analysée par des garanties théoriques et son comportement pratique est évalué par des expériences de simulations qui soutiennent nos conclusions.Show less >
English abstract : [en]
The goal of anomaly detection is to identify observations generated by a process that is different from a reference one. An accurate anomaly detector must ensure low false positive and false negative rates. However in the ...
Show more >The goal of anomaly detection is to identify observations generated by a process that is different from a reference one. An accurate anomaly detector must ensure low false positive and false negative rates. However in the online context such a constraint remains highly challenging due to the usual lack of control of the False Discovery Rate (FDR). In particular the online framework makes it impossible to use classical multiple testing approaches such as the Benjamini-Hochberg (BH) procedure. Our strategy overcomes this difficulty by exploiting a local control of the "modified FDR" (mFDR). An important ingredient in this control is the cardinality of the calibration set used for computing empirical p-values, which turns out to be an influential parameter. It results a new strategy for tuning this parameter, which yields the desired FDR control over the whole time series. The statistical performance of this strategy is analyzed by theoretical guarantees and its practical behavior is assessed by simulation experiments which support our conclusions.Show less >
Show more >The goal of anomaly detection is to identify observations generated by a process that is different from a reference one. An accurate anomaly detector must ensure low false positive and false negative rates. However in the online context such a constraint remains highly challenging due to the usual lack of control of the False Discovery Rate (FDR). In particular the online framework makes it impossible to use classical multiple testing approaches such as the Benjamini-Hochberg (BH) procedure. Our strategy overcomes this difficulty by exploiting a local control of the "modified FDR" (mFDR). An important ingredient in this control is the cardinality of the calibration set used for computing empirical p-values, which turns out to be an influential parameter. It results a new strategy for tuning this parameter, which yields the desired FDR control over the whole time series. The statistical performance of this strategy is analyzed by theoretical guarantees and its practical behavior is assessed by simulation experiments which support our conclusions.Show less >
Language :
Anglais
Collections :
Source :
Files
- document
- Open access
- Access the document
- article1-preprint.pdf
- Open access
- Access the document