Hickmann, M. Lautaro (2022) Reinforcement learning with variational quantum algorithms for trajectory planning. Master's, Universität Ulm.
PDF
4MB |
Abstract
Das Ziel dieser Arbeit ist es, Reinforcement Learning (RL) mit Variational Quantum Circuits (VQCs) mit Fokus auf seine Anwendbarkeit auf verschiedene Standard-RL-Probleme und Spurwechselmanöver zu untersuchen. Die untersuchten Hauptaspekte umfassten Machbarkeit, Einschränkungen und mögliche Vorteile beim Vergleich quantenerweiterter Systeme mit klassischen Systemen in RL. Wir konnten zeigen, dass VQCs mehrere einfache RL-Umgebungen lösen können und ähnliche oder sogar bessere Ergebnisse erzielen als ein klassischer Agent. Für das komplexere Spurwechselmanöver erzielten wir suboptimale Ergebnisse für das aktuelle Setup mit eingeschränkter Hyperparametersuche. Wir haben ferner gezeigt, dass Umgebungen mit einer doppelt so großen Beobachtungsvektorgröße wie zuvor veröffentlicht gelöst werden können. Wir fanden auch Hinweise auf mögliche Quantenvorteile in der Konvergenzrate und Stabilität für diskrete Zustandsraumumgebungen. Darüber hinaus haben wir auch gezeigt, dass der mit einem VQC implementierte Q-Learning-Algorithmus stark rauschanfällig ist, was zu Problemen bei der Verwendung von Noisy Intermediate-Scale Quantum (NISQ)-Hardware führt.
Item URL in elib: | https://elib.dlr.de/193987/ | ||||||||
---|---|---|---|---|---|---|---|---|---|
Document Type: | Thesis (Master's) | ||||||||
Additional Information: | Prüfer: Prof. Dr. Friedhelm Schwenker, Prof. Dr. Frank Köster Betreuer: Dr. Hans-Martin Rieser, Dr. Bogusz Bujnowski | ||||||||
Title: | Reinforcement learning with variational quantum algorithms for trajectory planning | ||||||||
Authors: |
| ||||||||
Date: | 30 May 2022 | ||||||||
Refereed publication: | Yes | ||||||||
Open Access: | Yes | ||||||||
Number of Pages: | 95 | ||||||||
Status: | Published | ||||||||
Keywords: | Quantum Machine Learning, Quantum Neural Networks, Reinforcement Learning, Quantum Reinforcement Learning, Autonomous Driving, Trajectory Planning, Variational Quantum Circuits | ||||||||
Institution: | Universität Ulm | ||||||||
Department: | Fakultät für Ingenieurwissenschaften, Informatik und Psychologie: Institut für Neuroinformatik | ||||||||
HGF - Research field: | Aeronautics, Space and Transport | ||||||||
HGF - Program: | Transport | ||||||||
HGF - Program Themes: | other | ||||||||
DLR - Research area: | Transport | ||||||||
DLR - Program: | V - no assignment | ||||||||
DLR - Research theme (Project): | V - no assignment, R - Reinforcement learning with quantum algorithms, D - short study [KIZ] | ||||||||
Location: | Ulm | ||||||||
Institutes and Institutions: | Institute for AI Safety and Security Institute of Transportation Systems > Cooperative Systems, BA | ||||||||
Deposited By: | Hickmann, Manuel Lautaro | ||||||||
Deposited On: | 17 Oct 2023 11:30 | ||||||||
Last Modified: | 17 Oct 2023 11:30 |
Repository Staff Only: item control page