L’Apprentissage Automatique pour la prise ...
Document type :
Thèse
Title :
L’Apprentissage Automatique pour la prise de Décisions
English title :
Machine Learning for Decision Making
Author(s) :
Thesis director(s) :
Rémi Munos
Alessandro Lazaric
Alessandro Lazaric
Defence date :
2015-05-12
Accredited body :
Université de Lille 1
Keyword(s) :
Apprentissage Automatique
Algorithme d’apprentissage incrémen- tal
Prise de Décision (statistique)
Bootstrap (statistique)
Risque
Prise de Décision
Optimisation
Bandit manchot (Mathématiques)
Algorithme d’apprentissage incrémen- tal
Prise de Décision (statistique)
Bootstrap (statistique)
Risque
Prise de Décision
Optimisation
Bandit manchot (Mathématiques)
English keyword(s) :
Machine Learning
Online Learning
Sequential Decision- Making
Bootstrap
Risk-Aversion
Decision-Making
Multi-Arm Bandit
Learning with Expert Advice
Online Learning
Sequential Decision- Making
Bootstrap
Risk-Aversion
Decision-Making
Multi-Arm Bandit
Learning with Expert Advice
HAL domain(s) :
Statistiques [stat]/Machine Learning [stat.ML]
French abstract :
La prise de décision stratégique concernant des ressources de valeur devrait tenir compte du degré d’aversion au risque. D’ailleurs, de nombreux domaines d’application mettent le risque au cœur de la prise de décision. ...
Show more >La prise de décision stratégique concernant des ressources de valeur devrait tenir compte du degré d’aversion au risque. D’ailleurs, de nombreux domaines d’application mettent le risque au cœur de la prise de décision. Toutefois, ce n’est pas le cas de l’apprentissage automatique. Ainsi, il semble essentiel de devoir fournir des indicateurs et des algorithmes dotant l’apprentissage automatique de la possibilité de prendre en considération le risque dans la prise de décision. En particulier, nous souhaiterions pouvoir estimer ce dernier sur de courtes séquences dépendantes générées à partir de la classe la plus générale possible de processus stochastiques en utilisant des outils théoriques d’inférence statistique et d’aversion au risque dans la prise de décision séquentielle. Cette thèse étudie ces deux problèmes en fournissant des méthodes algorithmiques prenant en considération le risque dans le cadre de la prise de décision en apprentissage automatique. Un algorithme avec des performances de pointe est proposé pour une estimation précise des statistiques de risque avec la classe la plus générale de processus ergodiques et stochastiques. De plus, la notion d’aversion au risque est introduite dans la prise de décision séquentielle (apprentissage en ligne) à la fois dans les jeux de bandits stochastiques et dans l’apprentissage séquentiel antagoniste.Show less >
Show more >La prise de décision stratégique concernant des ressources de valeur devrait tenir compte du degré d’aversion au risque. D’ailleurs, de nombreux domaines d’application mettent le risque au cœur de la prise de décision. Toutefois, ce n’est pas le cas de l’apprentissage automatique. Ainsi, il semble essentiel de devoir fournir des indicateurs et des algorithmes dotant l’apprentissage automatique de la possibilité de prendre en considération le risque dans la prise de décision. En particulier, nous souhaiterions pouvoir estimer ce dernier sur de courtes séquences dépendantes générées à partir de la classe la plus générale possible de processus stochastiques en utilisant des outils théoriques d’inférence statistique et d’aversion au risque dans la prise de décision séquentielle. Cette thèse étudie ces deux problèmes en fournissant des méthodes algorithmiques prenant en considération le risque dans le cadre de la prise de décision en apprentissage automatique. Un algorithme avec des performances de pointe est proposé pour une estimation précise des statistiques de risque avec la classe la plus générale de processus ergodiques et stochastiques. De plus, la notion d’aversion au risque est introduite dans la prise de décision séquentielle (apprentissage en ligne) à la fois dans les jeux de bandits stochastiques et dans l’apprentissage séquentiel antagoniste.Show less >
English abstract : [en]
Strategic decision-making over valuable resources should consider risk-averse objectives. Many practical areas of application consider risk as central to decision- making. However, machine learning does not. As a result, ...
Show more >Strategic decision-making over valuable resources should consider risk-averse objectives. Many practical areas of application consider risk as central to decision- making. However, machine learning does not. As a result, research should provide insights and algorithms that endow machine learning with the ability to consider decision-theoretic risk. In particular, in estimating decision-theoretic risk on short dependent sequences generated from the most general possible class of processes for statistical inference and through decision-theoretic risk objectives in sequential decision-making. This thesis studies these two problems to provide principled algorithmic methods for considering decision-theoretic risk in machine learning. An algorithm with state-of-the-art performance is introduced for accurate estimation of risk statistics on the most general class of stationary–ergodic processes and risk-averse objectives are introduced in sequential decision-making (online learning) in both the stochastic multi-arm bandit setting and the adversarial full-information setting.Show less >
Show more >Strategic decision-making over valuable resources should consider risk-averse objectives. Many practical areas of application consider risk as central to decision- making. However, machine learning does not. As a result, research should provide insights and algorithms that endow machine learning with the ability to consider decision-theoretic risk. In particular, in estimating decision-theoretic risk on short dependent sequences generated from the most general possible class of processes for statistical inference and through decision-theoretic risk objectives in sequential decision-making. This thesis studies these two problems to provide principled algorithmic methods for considering decision-theoretic risk in machine learning. An algorithm with state-of-the-art performance is introduced for accurate estimation of risk statistics on the most general class of stationary–ergodic processes and risk-averse objectives are introduced in sequential decision-making (online learning) in both the stochastic multi-arm bandit setting and the adversarial full-information setting.Show less >
Language :
Anglais
Collections :
Source :
Files
- https://tel.archives-ouvertes.fr/tel-01256178/document
- Open access
- Access the document
- https://tel.archives-ouvertes.fr/tel-01256178/document
- Open access
- Access the document
- https://tel.archives-ouvertes.fr/tel-01256178/document
- Open access
- Access the document
- document
- Open access
- Access the document
- AmirSani_Thesis.pdf
- Open access
- Access the document