Experimental quantum speed-up in reinforcement learning agents

Saggio, V. und Asenbeck, B. E. und Hamann, A. und Strömberg, T. und Schiansky, P. und Dunjko, V. und Friis, N. und Harris, N. C. und Hochberg, M. und Englund, D. und Wölk, Sabine Esther und Briegel, H. J. und Walther, P. (2021) Experimental quantum speed-up in reinforcement learning agents. Nature, 591 (7849), Seiten 229-233. Nature Publishing Group. doi: 10.1038/s41586-021-03242-7. ISSN 0028-0836.

	PDF - Preprintversion (eingereichte Entwurfsversion) 8MB
	PDF - Nur DLR-intern zugänglich - Verlagsversion (veröffentlichte Fassung) 2MB

Offizielle URL: http://dx.doi.org/10.1038/s41586-021-03242-7

Kurzfassung

As the field of artificial intelligence advances, the demand for algorithms that can learn quickly and efficiently increases. An important paradigm within artificial intelligence is reinforcement learning, where decision-making entities called agents interact with environments and learn by updating their behaviour on the basis of the obtained feedback. The crucial question for practical applications is how fast agents learn. Although various studies have made use of quantum mechanics to speed up the agent's decision-making process, a reduction in learning time has not yet been demonstrated. Here we present a reinforcement learning experiment in which the learning process of an agent is sped up by using a quantum communication channel with the environment. We further show that combining this scenario with classical communication enables the evaluation of this improvement and allows optimal control of the learning progress. We implement this learning protocol on a compact and fully tunable integrated nanophotonic processor. The device interfaces with telecommunication-wavelength photons and features a fast active-feedback mechanism, demonstrating the agent's systematic quantum advantage in a setup that could readily be integrated within future large-scale quantum communication networks.

elib-URL des Eintrags:

https://elib.dlr.de/141373/

Dokumentart:

Zeitschriftenbeitrag

Titel:

Experimental quantum speed-up in reinforcement learning agents

Autoren:

Autoren	Institution oder E-Mail-Adresse	Autoren-ORCID-iD	ORCID Put Code
Saggio, V.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Asenbeck, B. E.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Hamann, A.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Strömberg, T.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Schiansky, P.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Dunjko, V.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Friis, N.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Harris, N. C.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Hochberg, M.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Englund, D.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Wölk, Sabine Esther	Sabine.Woelk (at) dlr.de	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Briegel, H. J.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT
Walther, P.	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT	NICHT SPEZIFIZIERT

Datum:

März 2021

Erschienen in:

Nature

Referierte Publikation:

Open Access:

Nein

Gold Open Access:

Nein

In SCOPUS:

In ISI Web of Science:

Band:

591

DOI:

10.1038/s41586-021-03242-7

Seitenbereich:

Seiten 229-233

Verlag:

Nature Publishing Group

ISSN:

0028-0836

Status:

veröffentlicht

Stichwörter:

Quantum reinforcement learning

HGF - Forschungsbereich:

Luftfahrt, Raumfahrt und Verkehr

HGF - Programm:

Raumfahrt

HGF - Programmthema:

keine Zuordnung

DLR - Schwerpunkt:

Raumfahrt

DLR - Forschungsgebiet:

R - keine Zuordnung

DLR - Teilgebiet (Projekt, Vorhaben):

R - keine Zuordnung

Standort:

Ulm

Institute & Einrichtungen:

Institut für Quantentechnologien > Theoretische Quantenphysik

Hinterlegt von:

Wölk, Sabine Esther

Hinterlegt am:

16 Mär 2021 14:45

Letzte Änderung:

16 Mär 2021 14:45

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags