Raffin, Antonin und Hill, Ashley und Gleave, Adam und Kanervisto, Anssi und Ernestus, Maximilian und Dormann, Noah (2021) Stable-Baselines3: Reliable Reinforcement Learning Implementations. Journal of Machine Learning Research. Microtome Publishing. ISSN 1532-4435.
|
PDF
- Postprintversion (akzeptierte Manuskriptversion)
232kB |
Offizielle URL: https://www.jmlr.org/papers/v22/20-1364.html
Kurzfassung
Stable-Baselines3 provides open-source implementations of deep reinforcement learning (RL) algorithms in Python. The implementations have been benchmarked against reference codebases, and automated unit tests cover 95% of the code. The algorithms follow a consistent interface and are accompanied by extensive documentation, making it simple to train and compare different RL algorithms. Our documentation, examples, and source-code are available at https://github.com/DLR-RM/stable-baselines3.
| elib-URL des Eintrags: | https://elib.dlr.de/146386/ | ||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Dokumentart: | Zeitschriftenbeitrag | ||||||||||||||||||||||||||||
| Titel: | Stable-Baselines3: Reliable Reinforcement Learning Implementations | ||||||||||||||||||||||||||||
| Autoren: |
| ||||||||||||||||||||||||||||
| Datum: | 2021 | ||||||||||||||||||||||||||||
| Erschienen in: | Journal of Machine Learning Research | ||||||||||||||||||||||||||||
| Referierte Publikation: | Ja | ||||||||||||||||||||||||||||
| Open Access: | Ja | ||||||||||||||||||||||||||||
| Gold Open Access: | Nein | ||||||||||||||||||||||||||||
| In SCOPUS: | Ja | ||||||||||||||||||||||||||||
| In ISI Web of Science: | Ja | ||||||||||||||||||||||||||||
| Herausgeber: |
| ||||||||||||||||||||||||||||
| Verlag: | Microtome Publishing | ||||||||||||||||||||||||||||
| ISSN: | 1532-4435 | ||||||||||||||||||||||||||||
| Status: | veröffentlicht | ||||||||||||||||||||||||||||
| Stichwörter: | Reinforcement Learning, Baselines, Software, Open-Source, Python, PyTorch | ||||||||||||||||||||||||||||
| HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||||||||||||||||||||||
| HGF - Programm: | Raumfahrt | ||||||||||||||||||||||||||||
| HGF - Programmthema: | Robotik | ||||||||||||||||||||||||||||
| DLR - Schwerpunkt: | Raumfahrt | ||||||||||||||||||||||||||||
| DLR - Forschungsgebiet: | R RO - Robotik | ||||||||||||||||||||||||||||
| DLR - Teilgebiet (Projekt, Vorhaben): | R - Autonome, lernende Roboter [RO] | ||||||||||||||||||||||||||||
| Standort: | Oberpfaffenhofen | ||||||||||||||||||||||||||||
| Institute & Einrichtungen: | Institut für Robotik und Mechatronik (ab 2013) > Kognitive Robotik | ||||||||||||||||||||||||||||
| Hinterlegt von: | Raffin, Antonin | ||||||||||||||||||||||||||||
| Hinterlegt am: | 30 Nov 2021 14:45 | ||||||||||||||||||||||||||||
| Letzte Änderung: | 22 Dez 2023 11:09 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags