Playing games on a quantum computer using a quantum-enhanced actor-critic method for reinforcement learning

Baumgärtner, Timo (2024) Playing games on a quantum computer using a quantum-enhanced actor-critic method for reinforcement learning. Masterarbeit, Ulm University.

PDF - Nur DLR-intern zugänglich
4MB

Kurzfassung

Ziel dieser Arbeit ist die Untersuchung der unterschiedlichen Auswirkungen von Variational Quantum Circuits (VQC) im diskreten Soft Actor-Critic (SAC) Algorithmus. Hierzu werden verschiedene Varianten verglichen. Diese verwenden hybride quantum-klassische neuronale Netze entweder nur im Actor, nur im Critic oder in beiden. Als praktische Anwendung dient eine eigens entwickelte und angepasste Version des Spieles Pong. Die Ergebnisse zeigen vergleichbare erlernte Fähigkeiten für die Quantum Actors, bei gleichzeitiger geringerer Parameteranzahl als in der klassischen Variante. Jedoch zeigt sich, dass der Einsatz von VQCs als Critic den Lernprozess bei klassischen sowie Quantum Actors behindert. Wir vermuten den Grund in unzureichend abgestimmten Hyperparametern oder der fehlenden Expressivität des Modells. Abgesehen des Vorteils der geringeren Parameteranzahl zeigt sich ein deutlich langsamerer Trainingsprozess, welcher vermutlich durch die begrenzte Optimierung aktueller Quantum-Simulatoren bedingt ist.

elib-URL des Eintrags:

https://elib.dlr.de/207913/

Dokumentart:

Hochschulschrift (Masterarbeit)

Titel:

Playing games on a quantum computer using a quantum-enhanced actor-critic method for reinforcement learning

Autoren:

Autoren	Institution oder E-Mail-Adresse	Autoren-ORCID-iD	ORCID Put Code
Baumgärtner, Timo	timo.baumgaertner (at) dlr.de	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT

Datum:

29 Oktober 2024

Open Access:

Nein

Seitenanzahl:

107

Status:

veröffentlicht

Stichwörter:

Quantum Reinforcement Learning, Quantum Machine Learning, Quantum Neural Network, Variational Quantum Circuit, Reinforcement Learning, Games

Institution:

Ulm University

Abteilung:

Institute of Neural Information Processing

HGF - Forschungsbereich:

Luftfahrt, Raumfahrt und Verkehr

HGF - Programm:

Verkehr

HGF - Programmthema:

keine Zuordnung

DLR - Schwerpunkt:

Verkehr

DLR - Forschungsgebiet:

V - keine Zuordnung

DLR - Teilgebiet (Projekt, Vorhaben):

V - keine Zuordnung

Standort:

Ulm

Institute & Einrichtungen:

Institut für KI-Sicherheit

Hinterlegt von:

Baumgärtner, Timo

Hinterlegt am:

04 Nov 2024 08:56

Letzte Änderung:

04 Nov 2024 08:56

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags