Raffin, Antonin und Stulp, Freek (2020) Generalized State-Dependent Exploration for Deep Reinforcement Learning in Robotics. [sonstige Veröffentlichung]
![]() | Es ist eine neuere Version dieses Eintrags verfügbar. |
![]() |
PDF
873kB |
Offizielle URL: https://arxiv.org/abs/2005.05719
Kurzfassung
Reinforcement learning (RL) enables robots to learn skills from interactions with the real world. In practice, the unstructured step-based exploration used in Deep RL -- often very successful in simulation -- leads to jerky motion patterns on real robots. Consequences of the resulting shaky behavior are poor exploration, or even damage to the robot. We address these issues by adapting state-dependent exploration (SDE) to current Deep RL algorithms. To enable this adaptation, we propose three extensions to the original SDE, which leads to a new exploration method generalized state-dependent exploration (gSDE). We evaluate gSDE both in simulation, on PyBullet continuous control tasks, and directly on a tendon-driven elastic robot. gSDE yields competitive results in simulation but outperforms the unstructured exploration on the real robot.
elib-URL des Eintrags: | https://elib.dlr.de/136103/ | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Dokumentart: | sonstige Veröffentlichung | ||||||||||||
Zusätzliche Informationen: | Code: https://github.com/DLR-RM/stable-baselines3 | ||||||||||||
Titel: | Generalized State-Dependent Exploration for Deep Reinforcement Learning in Robotics | ||||||||||||
Autoren: |
| ||||||||||||
Datum: | 12 Mai 2020 | ||||||||||||
Erschienen in: | Arxiv | ||||||||||||
Referierte Publikation: | Nein | ||||||||||||
Open Access: | Ja | ||||||||||||
Status: | veröffentlicht | ||||||||||||
Stichwörter: | obotics, Reinforcement Learning, Exploration | ||||||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||||||
HGF - Programm: | Raumfahrt | ||||||||||||
HGF - Programmthema: | Technik für Raumfahrtsysteme | ||||||||||||
DLR - Schwerpunkt: | Raumfahrt | ||||||||||||
DLR - Forschungsgebiet: | R SY - Technik für Raumfahrtsysteme | ||||||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | R - Autonome, lernende Roboter [SY] | ||||||||||||
Standort: | Oberpfaffenhofen | ||||||||||||
Institute & Einrichtungen: | Institut für Robotik und Mechatronik (ab 2013) > Kognitive Robotik | ||||||||||||
Hinterlegt von: | Raffin, Antonin | ||||||||||||
Hinterlegt am: | 21 Sep 2020 11:25 | ||||||||||||
Letzte Änderung: | 28 Mär 2023 23:57 |
Verfügbare Versionen dieses Eintrags
- Generalized State-Dependent Exploration for Deep Reinforcement Learning in Robotics. (deposited 21 Sep 2020 11:25) [Gegenwärtig angezeigt]
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags