Baumgärtner, Timo (2024) Playing games on a quantum computer using a quantum-enhanced actor-critic method for reinforcement learning. Masterarbeit, Ulm University.
PDF
- Nur DLR-intern zugänglich
4MB |
Kurzfassung
Ziel dieser Arbeit ist die Untersuchung der unterschiedlichen Auswirkungen von Variational Quantum Circuits (VQC) im diskreten Soft Actor-Critic (SAC) Algorithmus. Hierzu werden verschiedene Varianten verglichen. Diese verwenden hybride quantum-klassische neuronale Netze entweder nur im Actor, nur im Critic oder in beiden. Als praktische Anwendung dient eine eigens entwickelte und angepasste Version des Spieles Pong. Die Ergebnisse zeigen vergleichbare erlernte Fähigkeiten für die Quantum Actors, bei gleichzeitiger geringerer Parameteranzahl als in der klassischen Variante. Jedoch zeigt sich, dass der Einsatz von VQCs als Critic den Lernprozess bei klassischen sowie Quantum Actors behindert. Wir vermuten den Grund in unzureichend abgestimmten Hyperparametern oder der fehlenden Expressivität des Modells. Abgesehen des Vorteils der geringeren Parameteranzahl zeigt sich ein deutlich langsamerer Trainingsprozess, welcher vermutlich durch die begrenzte Optimierung aktueller Quantum-Simulatoren bedingt ist.
elib-URL des Eintrags: | https://elib.dlr.de/207913/ | ||||||||
---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Hochschulschrift (Masterarbeit) | ||||||||
Titel: | Playing games on a quantum computer using a quantum-enhanced actor-critic method for reinforcement learning | ||||||||
Autoren: |
| ||||||||
Datum: | 29 Oktober 2024 | ||||||||
Open Access: | Nein | ||||||||
Seitenanzahl: | 107 | ||||||||
Status: | veröffentlicht | ||||||||
Stichwörter: | Quantum Reinforcement Learning, Quantum Machine Learning, Quantum Neural Network, Variational Quantum Circuit, Reinforcement Learning, Games | ||||||||
Institution: | Ulm University | ||||||||
Abteilung: | Institute of Neural Information Processing | ||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||
HGF - Programm: | Verkehr | ||||||||
HGF - Programmthema: | keine Zuordnung | ||||||||
DLR - Schwerpunkt: | Verkehr | ||||||||
DLR - Forschungsgebiet: | V - keine Zuordnung | ||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | V - keine Zuordnung | ||||||||
Standort: | Ulm | ||||||||
Institute & Einrichtungen: | Institut für KI-Sicherheit | ||||||||
Hinterlegt von: | Baumgärtner, Timo | ||||||||
Hinterlegt am: | 04 Nov 2024 08:56 | ||||||||
Letzte Änderung: | 04 Nov 2024 08:56 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags