elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Closing the Gap: Combining Task Specification and Reinforcement Learning for Compliant Vegetable Cutting

Padalkar, Abhishek und Nieuwenhuisen, Matthias und Schulz, Dirk und Stulp, Freek (2022) Closing the Gap: Combining Task Specification and Reinforcement Learning for Compliant Vegetable Cutting. In: International Conference on Informatics in Control, Automation and Robotics Lecture Notes in Electrical Engineering, 793. Springer. Seiten 187-206. doi: 10.1007/978-3-030-92442-3_11. ISBN 978-3-030-92441-6. ISSN 1876-1100.

[img] PDF - Nur DLR-intern zugänglich - Verlagsversion (veröffentlichte Fassung)
2MB

Offizielle URL: https://link.springer.com/chapter/10.1007/978-3-030-92442-3_11

Kurzfassung

Easy-to-define but flexible behaviors are key to the successful deployment of service robots in more everyday situations. Complex modeling of the world dynamics is infeasible outside of very controlled environments like manufacturing cells. Learning new behaviors has the advantage of a high flexibility, but comes at the price of prohibitively many learning iterations when applied on a real robot system. We combine learning with a simple task specification to guide the learning process with human knowledge about the problem. As application, we demonstrate a compliant manipulation task using reinforcement learning guided by the Task Frame Formalism. This allows us to specify the easy to model knowledge about a task while the robot learns the unmodeled components by reinforcement learning. We evaluate the approach by cutting vegetables with a KUKA LWR 4+ manipulator. The robot was able to learn force control policies directly on the robot without using any simulation.

elib-URL des Eintrags:https://elib.dlr.de/185811/
Dokumentart:Beitrag im Sammelband
Titel:Closing the Gap: Combining Task Specification and Reinforcement Learning for Compliant Vegetable Cutting
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Padalkar, AbhishekAbhishek.Padalkar (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Nieuwenhuisen, Matthiasmatthias.nieuwenhuisen (at) fkie.fraunhofer.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Schulz, Dirkdirk.schulz (at) fkie.fraunhofer.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Stulp, FreekFreek.Stulp (at) dlr.dehttps://orcid.org/0000-0001-9555-9517NICHT SPEZIFIZIERT
Datum:1 Januar 2022
Erschienen in:International Conference on Informatics in Control, Automation and Robotics
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
Band:793
DOI:10.1007/978-3-030-92442-3_11
Seitenbereich:Seiten 187-206
Verlag:Springer
Name der Reihe:Lecture Notes in Electrical Engineering
ISSN:1876-1100
ISBN:978-3-030-92441-6
Status:veröffentlicht
Stichwörter:Compliant manipulation, Reinforcement learning, Task frame formalism
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Robotik
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R RO - Robotik
DLR - Teilgebiet (Projekt, Vorhaben):R - Autonome, lernende Roboter [RO]
Standort: Oberpfaffenhofen
Institute & Einrichtungen:Institut für Robotik und Mechatronik (ab 2013) > Kognitive Robotik
Hinterlegt von: Padalkar, Abhishek
Hinterlegt am:07 Jul 2022 16:26
Letzte Änderung:20 Okt 2023 07:24

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.