"I'm sorry Dave, I'm afraid I can't do ...
Document type :
Communication dans un congrès avec actes
Permalink :
Title :
"I'm sorry Dave, I'm afraid I can't do that" Deep Q-Learning From Forbidden Actions
Author(s) :
Seurin, Mathieu [Auteur]
Sequential Learning [SEQUEL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Université de Lille
Preux, Philippe [Auteur]
Sequential Learning [SEQUEL]
Pietquin, Olivier [Auteur]
Google Brain, Paris
Sequential Learning [SEQUEL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Université de Lille
Preux, Philippe [Auteur]

Sequential Learning [SEQUEL]
Pietquin, Olivier [Auteur]
Google Brain, Paris
Conference title :
Workshop on Safety and Robustness in Decision Making (NeurIPS 2019)
City :
Vancouver
Country :
Canada
Start date of the conference :
2019-12-13
HAL domain(s) :
Informatique [cs]/Intelligence artificielle [cs.AI]
Informatique [cs]/Apprentissage [cs.LG]
Informatique [cs]/Réseau de neurones [cs.NE]
Informatique [cs]/Apprentissage [cs.LG]
Informatique [cs]/Réseau de neurones [cs.NE]
Language :
Anglais
Peer reviewed article :
Non
Audience :
Internationale
Popular science :
Non
Collections :
Source :
Submission date :
2020-05-28T07:21:16Z
Files
- https://hal.inria.fr/hal-02387419/document
- Open access
- Access the document