elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Grammar Based Identification Of Speaker Role For Improving ATCO And Pilot ASR

Prasad, Amrutha und Zuluaga-Gomez, Juan Pablo und Motlicek, Petr und Ohneiser, Oliver und Helmke, Hartmut und Sarfjoo, Saeed und Nigmatulina, Iuliia (2021) Grammar Based Identification Of Speaker Role For Improving ATCO And Pilot ASR. Interspeech 2021 Satellite Workshop "Automatic Speech Recognition in Air Traffic Management (ASR-ATM)", 30. Aug 2021, Brno, Tschechien (hybrid).

Dieses Archiv kann nicht den Volltext zur Verfügung stellen.

Offizielle URL: https://www.haawaii.de/wp/wp-content/uploads/2021/08/Multi_task_learning_Interspeech2021.pdf

Kurzfassung

Assistant Based Speech Recognition (ABSR) for air traffic control is generally trained by pooling both Air Traffic Controller (ATCO) and pilot data. In practice, this is motivated by the fact that the proportion of pilot data is lesser compared to ATCO while their standard language of communication is similar. However, due to data imbalance of ATCO and pilot and their varying acoustic conditions, the ASR performance is usually significantly better for ATCOs than pilots. In this paper, we propose to (1) split the ATCO and pilot data using an automatic approach exploiting ASR transcripts, and (2) consider ATCO and pilot ASR as two separate tasks for Acoustic Model (AM) training. For speaker role classification of ATCO and pilot data, a hypothesized ASR transcript is generated with a seed model, subsequently used to classify the speaker role based on the knowledge extracted from grammar defined by International Civil Aviation Organization (ICAO). This approach provides an average speaker role identification accuracy of 83% for ATCO and pilot. Finally, we show that training AMs separately for each task, or using a multitask approach is well suited for this data compared to AM trained by pooling all data.

elib-URL des Eintrags:https://elib.dlr.de/143895/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Grammar Based Identification Of Speaker Role For Improving ATCO And Pilot ASR
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Prasad, AmruthaIdiap, BUTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Zuluaga-Gomez, Juan PabloIdiap, EPFLNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Motlicek, PetrPetr.Motlicek (at) idiap.chNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Ohneiser, OliverOliver.Ohneiser (at) dlr.dehttps://orcid.org/0000-0002-5411-691XNICHT SPEZIFIZIERT
Helmke, Hartmuthartmut.helmke (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Sarfjoo, SaeedIdiapNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Nigmatulina, IuliiaIdiapNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:2021
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Nein
In ISI Web of Science:Nein
Status:veröffentlicht
Stichwörter:assistant based speech recognition; air traffic management; multitask acoustic model; speaker classification
Veranstaltungstitel:Interspeech 2021 Satellite Workshop "Automatic Speech Recognition in Air Traffic Management (ASR-ATM)"
Veranstaltungsort:Brno, Tschechien (hybrid)
Veranstaltungsart:Workshop
Veranstaltungsdatum:30. Aug 2021
Veranstalter :BUT, DLR, Idiap
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Luftfahrt
HGF - Programmthema:Luftverkehr und Auswirkungen
DLR - Schwerpunkt:Luftfahrt
DLR - Forschungsgebiet:L AI - Luftverkehr und Auswirkungen
DLR - Teilgebiet (Projekt, Vorhaben):L - Faktor Mensch
Standort: Braunschweig
Institute & Einrichtungen:Institut für Flugführung > Lotsenassistenz
Hinterlegt von: Ohneiser, Oliver
Hinterlegt am:14 Sep 2021 10:22
Letzte Änderung:06 Dez 2021 11:56

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.