Raffin, Antonin und Hill, Ashley und Gleave, Adam und Kanervisto, Anssi und Ernestus, Maximilian und Dormann, Noah (2021) Stable-Baselines3: Reliable Reinforcement Learning Implementations. Journal of Machine Learning Research. Microtome Publishing. ISSN 1532-4435.
PDF
- Postprintversion (akzeptierte Manuskriptversion)
232kB |
Offizielle URL: https://www.jmlr.org/papers/v22/20-1364.html
Kurzfassung
Stable-Baselines3 provides open-source implementations of deep reinforcement learning (RL) algorithms in Python. The implementations have been benchmarked against reference codebases, and automated unit tests cover 95% of the code. The algorithms follow a consistent interface and are accompanied by extensive documentation, making it simple to train and compare different RL algorithms. Our documentation, examples, and source-code are available at https://github.com/DLR-RM/stable-baselines3.
elib-URL des Eintrags: | https://elib.dlr.de/146386/ | ||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Zeitschriftenbeitrag | ||||||||||||||||||||||||||||
Titel: | Stable-Baselines3: Reliable Reinforcement Learning Implementations | ||||||||||||||||||||||||||||
Autoren: |
| ||||||||||||||||||||||||||||
Datum: | 2021 | ||||||||||||||||||||||||||||
Erschienen in: | Journal of Machine Learning Research | ||||||||||||||||||||||||||||
Referierte Publikation: | Ja | ||||||||||||||||||||||||||||
Open Access: | Ja | ||||||||||||||||||||||||||||
Gold Open Access: | Nein | ||||||||||||||||||||||||||||
In SCOPUS: | Ja | ||||||||||||||||||||||||||||
In ISI Web of Science: | Ja | ||||||||||||||||||||||||||||
Herausgeber: |
| ||||||||||||||||||||||||||||
Verlag: | Microtome Publishing | ||||||||||||||||||||||||||||
ISSN: | 1532-4435 | ||||||||||||||||||||||||||||
Status: | veröffentlicht | ||||||||||||||||||||||||||||
Stichwörter: | Reinforcement Learning, Baselines, Software, Open-Source, Python, PyTorch | ||||||||||||||||||||||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||||||||||||||||||||||
HGF - Programm: | Raumfahrt | ||||||||||||||||||||||||||||
HGF - Programmthema: | Robotik | ||||||||||||||||||||||||||||
DLR - Schwerpunkt: | Raumfahrt | ||||||||||||||||||||||||||||
DLR - Forschungsgebiet: | R RO - Robotik | ||||||||||||||||||||||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | R - Autonome, lernende Roboter [RO] | ||||||||||||||||||||||||||||
Standort: | Oberpfaffenhofen | ||||||||||||||||||||||||||||
Institute & Einrichtungen: | Institut für Robotik und Mechatronik (ab 2013) > Kognitive Robotik | ||||||||||||||||||||||||||||
Hinterlegt von: | Raffin, Antonin | ||||||||||||||||||||||||||||
Hinterlegt am: | 30 Nov 2021 14:45 | ||||||||||||||||||||||||||||
Letzte Änderung: | 22 Dez 2023 11:09 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags