Eintrag in der Universitätsbibliographie der TU Chemnitz
Lötzsch, Winfried ;
Vitay, Julien ;
Hamker, Fred H.
Eibl, Maximilian ; Gädke, Martin (Hrsg.)
Training a deep policy gradient-based neural network with asynchronous learners on a simulated robotic problem
Universität: | Technische Universität Chemnitz | |
Institut: | Professur Künstliche Intelligenz | |
Dokumentart: | Konferenzbeitrag, referiert | |
ISBN/ISSN: | ISBN: 978-3-88579-669-5 ; ISSN: 1617-5468 | |
DOI: | doi:10.18420/in2017_214 | |
Quelle: | 47. Jahrestagung der Gesellschaft für Informatik e.V. (GI). - Bonn : Gesellschaft für Informatik, 2017. - Lecture Notes in Informatics | |
Freie Schlagwörter (Englisch): | deep learning , reinforcement learning , robotics , policy gradient methods , actor critic , asynchronous learning , continuous action space | |
OA-Lizenz | CC BY-NC 3.0 |