elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

An Open-Loop Baseline for Reinforcement Learning Locomotion Tasks

Raffin, Antonin und Sigaud, Olivier und Kober, Jens und Albu-Schäffer, Alin Olimpiu und Silverio, Joao und Stulp, Freek (2024) An Open-Loop Baseline for Reinforcement Learning Locomotion Tasks. Reinforcement Learning Journal (RLJ), 1 (1), Seiten 92-107. Reinforcement Learning Conference. doi: 10.5281/zenodo.13899776. ISSN 2996-8569.

[img] PDF - Verlagsversion (veröffentlichte Fassung)
928kB

Offizielle URL: https://rlj.cs.umass.edu/2024/papers/Paper18.html

Kurzfassung

In search of a simple baseline for Deep Reinforcement Learning in locomotion tasks, we propose a model-free open-loop strategy. By leveraging prior knowledge and the elegance of simple oscillators to generate periodic joint motions, it achieves respectable performance in five different locomotion environments, with a number of tunable parameters that is a tiny fraction of the thousands typically required by DRL algorithms. We conduct two additional experiments using open-loop oscillators to identify current shortcomings of these algorithms. Our results show that, compared to the baseline, DRL is more prone to performance degradation when exposed to sensor noise or failure. Furthermore, we demonstrate a successful transfer from simulation to reality using an elastic quadruped, where RL fails without randomization or reward engineering. Overall, the proposed baseline and associated experiments highlight the existing limitations of DRL for robotic applications, provide insights on how to address them, and encourage reflection on the costs of complexity and generality.

elib-URL des Eintrags:https://elib.dlr.de/207306/
Dokumentart:Zeitschriftenbeitrag
Zusätzliche Informationen:This work was also supported by ITECH R&D programs of MOTIE/KEIT under Grant 20026194
Titel:An Open-Loop Baseline for Reinforcement Learning Locomotion Tasks
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Raffin, AntoninAntonin.Raffin (at) dlr.dehttps://orcid.org/0000-0001-6036-6950NICHT SPEZIFIZIERT
Sigaud, OlivierSorbonne Universitéhttps://orcid.org/0000-0002-8544-0229NICHT SPEZIFIZIERT
Kober, Jensj.kober (at) tudelft.nlhttps://orcid.org/0000-0001-7257-5434NICHT SPEZIFIZIERT
Albu-Schäffer, Alin OlimpiuAlin.Albu-Schaeffer (at) dlr.dehttps://orcid.org/0000-0001-5343-9074169497195
Silverio, Joaojoao.silverio (at) dlr.dehttps://orcid.org/0000-0003-1428-8933NICHT SPEZIFIZIERT
Stulp, FreekFreek.Stulp (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:14 September 2024
Erschienen in:Reinforcement Learning Journal (RLJ)
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Nein
In ISI Web of Science:Nein
Band:1
DOI:10.5281/zenodo.13899776
Seitenbereich:Seiten 92-107
Herausgeber:
HerausgeberInstitution und/oder E-Mail-Adresse der HerausgeberHerausgeber-ORCID-iDORCID Put Code
Thomas, Philip S.pthomas (at) cs.umass.eduNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Verlag:Reinforcement Learning Conference
ISSN:2996-8569
Status:veröffentlicht
Stichwörter:reinforcement learning, open loop, benchmark
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Robotik
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R RO - Robotik
DLR - Teilgebiet (Projekt, Vorhaben):R - Autonome, lernende Roboter [RO]
Standort: Oberpfaffenhofen
Institute & Einrichtungen:Institut für Robotik und Mechatronik (ab 2013) > Kognitive Robotik
Hinterlegt von: Raffin, Antonin
Hinterlegt am:14 Okt 2024 09:49
Letzte Änderung:14 Okt 2024 09:49

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.