Stable-Baselines3: Reliable Reinforcement Learning Implementations

Raffin, Antonin und Hill, Ashley und Gleave, Adam und Kanervisto, Anssi und Ernestus, Maximilian und Dormann, Noah (2021) Stable-Baselines3: Reliable Reinforcement Learning Implementations. Journal of Machine Learning Research. Microtome Publishing. ISSN 1532-4435.

PDF - Postprintversion (akzeptierte Manuskriptversion)
232kB

Offizielle URL: https://www.jmlr.org/papers/v22/20-1364.html

Kurzfassung

Stable-Baselines3 provides open-source implementations of deep reinforcement learning (RL) algorithms in Python. The implementations have been benchmarked against reference codebases, and automated unit tests cover 95% of the code. The algorithms follow a consistent interface and are accompanied by extensive documentation, making it simple to train and compare different RL algorithms. Our documentation, examples, and source-code are available at https://github.com/DLR-RM/stable-baselines3.

elib-URL des Eintrags:

https://elib.dlr.de/146386/

Dokumentart:

Zeitschriftenbeitrag

Titel:

Stable-Baselines3: Reliable Reinforcement Learning Implementations

Autoren:

Autoren	Institution oder E-Mail-Adresse	Autoren-ORCID-iD	ORCID Put Code
Raffin, Antonin	Antonin.Raffin (at) dlr.de	https://orcid.org/0000-0001-6036-6950	NICHT SPEZIFIZIERT
Hill, Ashley	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Gleave, Adam	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Kanervisto, Anssi	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Ernestus, Maximilian	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Dormann, Noah	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT

Datum:

2021

Erschienen in:

Journal of Machine Learning Research

Referierte Publikation:

Open Access:

Gold Open Access:

Nein

In SCOPUS:

In ISI Web of Science:

Herausgeber:

Herausgeber	Institution und/oder E-Mail-Adresse der Herausgeber	Herausgeber-ORCID-iD	ORCID Put Code
Mueller, Andreas	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT

Verlag:

Microtome Publishing

ISSN:

1532-4435

Status:

veröffentlicht

Stichwörter:

Reinforcement Learning, Baselines, Software, Open-Source, Python, PyTorch

HGF - Forschungsbereich:

Luftfahrt, Raumfahrt und Verkehr

HGF - Programm:

Raumfahrt

HGF - Programmthema:

Robotik

DLR - Schwerpunkt:

Raumfahrt

DLR - Forschungsgebiet:

R RO - Robotik

DLR - Teilgebiet (Projekt, Vorhaben):

R - Autonome, lernende Roboter [RO]

Standort:

Oberpfaffenhofen

Institute & Einrichtungen:

Institut für Robotik und Mechatronik (ab 2013) > Kognitive Robotik

Hinterlegt von:

Raffin, Antonin

Hinterlegt am:

30 Nov 2021 14:45

Letzte Änderung:

22 Dez 2023 11:09

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags