Hickmann, M. Lautaro (2022) Reinforcement learning with variational quantum algorithms for trajectory planning. Masterarbeit, Universität Ulm.
PDF
4MB |
Kurzfassung
Das Ziel dieser Arbeit ist es, Reinforcement Learning (RL) mit Variational Quantum Circuits (VQCs) mit Fokus auf seine Anwendbarkeit auf verschiedene Standard-RL-Probleme und Spurwechselmanöver zu untersuchen. Die untersuchten Hauptaspekte umfassten Machbarkeit, Einschränkungen und mögliche Vorteile beim Vergleich quantenerweiterter Systeme mit klassischen Systemen in RL. Wir konnten zeigen, dass VQCs mehrere einfache RL-Umgebungen lösen können und ähnliche oder sogar bessere Ergebnisse erzielen als ein klassischer Agent. Für das komplexere Spurwechselmanöver erzielten wir suboptimale Ergebnisse für das aktuelle Setup mit eingeschränkter Hyperparametersuche. Wir haben ferner gezeigt, dass Umgebungen mit einer doppelt so großen Beobachtungsvektorgröße wie zuvor veröffentlicht gelöst werden können. Wir fanden auch Hinweise auf mögliche Quantenvorteile in der Konvergenzrate und Stabilität für diskrete Zustandsraumumgebungen. Darüber hinaus haben wir auch gezeigt, dass der mit einem VQC implementierte Q-Learning-Algorithmus stark rauschanfällig ist, was zu Problemen bei der Verwendung von Noisy Intermediate-Scale Quantum (NISQ)-Hardware führt.
elib-URL des Eintrags: | https://elib.dlr.de/193987/ | ||||||||
---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Hochschulschrift (Masterarbeit) | ||||||||
Zusätzliche Informationen: | Prüfer: Prof. Dr. Friedhelm Schwenker, Prof. Dr. Frank Köster Betreuer: Dr. Hans-Martin Rieser, Dr. Bogusz Bujnowski | ||||||||
Titel: | Reinforcement learning with variational quantum algorithms for trajectory planning | ||||||||
Autoren: |
| ||||||||
Datum: | 30 Mai 2022 | ||||||||
Referierte Publikation: | Ja | ||||||||
Open Access: | Ja | ||||||||
Seitenanzahl: | 95 | ||||||||
Status: | veröffentlicht | ||||||||
Stichwörter: | Quantum Machine Learning, Quantum Neural Networks, Reinforcement Learning, Quantum Reinforcement Learning, Autonomous Driving, Trajectory Planning, Variational Quantum Circuits | ||||||||
Institution: | Universität Ulm | ||||||||
Abteilung: | Fakultät für Ingenieurwissenschaften, Informatik und Psychologie: Institut für Neuroinformatik | ||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||
HGF - Programm: | Verkehr | ||||||||
HGF - Programmthema: | keine Zuordnung | ||||||||
DLR - Schwerpunkt: | Verkehr | ||||||||
DLR - Forschungsgebiet: | V - keine Zuordnung | ||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | V - keine Zuordnung, R - Bestärkendes Lernen mit Quantenalgorithmen, D - Kurzstudien [KIZ] | ||||||||
Standort: | Ulm | ||||||||
Institute & Einrichtungen: | Institut für KI-Sicherheit Institut für Verkehrssystemtechnik > Kooperative Systeme, BA | ||||||||
Hinterlegt von: | Hickmann, Manuel Lautaro | ||||||||
Hinterlegt am: | 17 Okt 2023 11:30 | ||||||||
Letzte Änderung: | 17 Okt 2023 11:30 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags