Reinforcement learning with variational quantum algorithms for trajectory planning

Hickmann, M. Lautaro (2022) Reinforcement learning with variational quantum algorithms for trajectory planning. Masterarbeit, Universität Ulm.

PDF
4MB

Kurzfassung

Das Ziel dieser Arbeit ist es, Reinforcement Learning (RL) mit Variational Quantum Circuits (VQCs) mit Fokus auf seine Anwendbarkeit auf verschiedene Standard-RL-Probleme und Spurwechselmanöver zu untersuchen. Die untersuchten Hauptaspekte umfassten Machbarkeit, Einschränkungen und mögliche Vorteile beim Vergleich quantenerweiterter Systeme mit klassischen Systemen in RL. Wir konnten zeigen, dass VQCs mehrere einfache RL-Umgebungen lösen können und ähnliche oder sogar bessere Ergebnisse erzielen als ein klassischer Agent. Für das komplexere Spurwechselmanöver erzielten wir suboptimale Ergebnisse für das aktuelle Setup mit eingeschränkter Hyperparametersuche. Wir haben ferner gezeigt, dass Umgebungen mit einer doppelt so großen Beobachtungsvektorgröße wie zuvor veröffentlicht gelöst werden können. Wir fanden auch Hinweise auf mögliche Quantenvorteile in der Konvergenzrate und Stabilität für diskrete Zustandsraumumgebungen. Darüber hinaus haben wir auch gezeigt, dass der mit einem VQC implementierte Q-Learning-Algorithmus stark rauschanfällig ist, was zu Problemen bei der Verwendung von Noisy Intermediate-Scale Quantum (NISQ)-Hardware führt.

elib-URL des Eintrags:

https://elib.dlr.de/193987/

Dokumentart:

Hochschulschrift (Masterarbeit)

Zusätzliche Informationen:

Prüfer: Prof. Dr. Friedhelm Schwenker, Prof. Dr. Frank Köster Betreuer: Dr. Hans-Martin Rieser, Dr. Bogusz Bujnowski

Titel:

Reinforcement learning with variational quantum algorithms for trajectory planning

Autoren:

Autoren	Institution oder E-Mail-Adresse	Autoren-ORCID-iD	ORCID Put Code
Hickmann, M. Lautaro	Lautaro.Hickmann (at) dlr.de	https://orcid.org/0000-0002-9501-4004	144602967

Datum:

30 Mai 2022

Referierte Publikation:

Open Access:

Seitenanzahl:

Status:

veröffentlicht

Stichwörter:

Quantum Machine Learning, Quantum Neural Networks, Reinforcement Learning, Quantum Reinforcement Learning, Autonomous Driving, Trajectory Planning, Variational Quantum Circuits

Institution:

Universität Ulm

Abteilung:

Fakultät für Ingenieurwissenschaften, Informatik und Psychologie: Institut für Neuroinformatik

HGF - Forschungsbereich:

Luftfahrt, Raumfahrt und Verkehr

HGF - Programm:

Verkehr

HGF - Programmthema:

keine Zuordnung

DLR - Schwerpunkt:

Verkehr

DLR - Forschungsgebiet:

V - keine Zuordnung

DLR - Teilgebiet (Projekt, Vorhaben):

V - keine Zuordnung, R - Bestärkendes Lernen mit Quantenalgorithmen, D - Kurzstudien [KIZ]

Standort:

Ulm

Institute & Einrichtungen:

Institut für KI-Sicherheit
Institut für Verkehrssystemtechnik > Kooperative Systeme, BA

Hinterlegt von:

Hickmann, Manuel Lautaro

Hinterlegt am:

17 Okt 2023 11:30

Letzte Änderung:

17 Okt 2023 11:30

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags