elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Semi-supervised Learning with Semantic Knowledge Extraction for Improved Speech Recognition in Air Traffic Control

Srinivasamurthy, Ajay und Motlice, Petr und Himawan, Ivan und Szaszák, György und Oualil, Youssef und Helmke, Hartmut (2017) Semi-supervised Learning with Semantic Knowledge Extraction for Improved Speech Recognition in Air Traffic Control. Interspeech 2017, 20.-24. August 2017, Stockholm, Schweden.

WarnungEs ist eine neuere Version dieses Eintrags verfügbar.

Dieses Archiv kann nicht den Volltext zur Verfügung stellen.

Kurzfassung

Automatic Speech Recognition (ASR) can introduce higher levels of automation into Air Traffic Control (ATC), where spoken language is still the predominant form of communication. While ATC uses standard phraseology and a limited vocabulary, we need to adapt the speech recognition systems to local acoustic conditions and vocabularies at each airport to reach optimal performance. Due to continuous operation of ATC systems, a large and increasing amount of untranscribed speech data is available, allowing for semi-supervised learning methods to build and adapt ASR models. In this paper, we first identify the challenges in building ASR systems for specific ATC areas and propose to utilize out-of-domain data to build baseline ASR models. Then we explore different methods of data selection for adapting baseline models by exploiting the continuously increasing untranscribed data. We develop a basic approach capable of exploiting semantic representations of ATC commands. We achieve relative improvement in both word error rate (23.5%) and concept error rates (7%) when adapting ASR models to different ATC conditions in a semi-supervised manner.

elib-URL des Eintrags:https://elib.dlr.de/112487/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Semi-supervised Learning with Semantic Knowledge Extraction for Improved Speech Recognition in Air Traffic Control
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Srinivasamurthy, Ajayajay.srinivasamurthy (at) idiap.chNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Motlice, Petrpetr.motlicek (at) idiap.chNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Himawan, Ivanivan.himawan (at) idiap.chNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Szaszák, Györgygszaszak (at) lsv.uni-saarland.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Oualil, Youssefyoualil (at) lsv.uni-saarland.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Helmke, Hartmuthartmut.helmke (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:2017
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Nein
In ISI Web of Science:Nein
Seitenbereich:Seiten 1-5
Status:veröffentlicht
Stichwörter:Speech Recognition, Air Traffic Control, Semisupervised learning
Veranstaltungstitel:Interspeech 2017
Veranstaltungsort:Stockholm, Schweden
Veranstaltungsart:internationale Konferenz
Veranstaltungsdatum:20.-24. August 2017
Veranstalter :Department of Linguistics, Stockholm University; Department of Speech, Music and Hearing, KTH Royal Institute of Technology; Division of Speech and Language Pathology, Karolinska Institutet PCO: Akademikonferens
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Luftfahrt
HGF - Programmthema:Luftverkehrsmanagement und Flugbetrieb
DLR - Schwerpunkt:Luftfahrt
DLR - Forschungsgebiet:L AO - Air Traffic Management and Operation
DLR - Teilgebiet (Projekt, Vorhaben):L - Effiziente Flugführung (alt)
Standort: Braunschweig
Institute & Einrichtungen:Institut für Flugführung > Lotsenassistenz
Hinterlegt von: Diederich, Kerstin
Hinterlegt am:28 Jun 2017 14:57
Letzte Änderung:21 Dez 2017 15:39

Verfügbare Versionen dieses Eintrags

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.