elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Customization of Automatic Speech Recognition Engines for Rare Word Detection Without Costly Model Re-Training

Bhattacharjee, Mrinmoy und Motlicek, Petr und Nigmatulina, Iuliia und Helmke, Hartmut und Ohneiser, Oliver und Kleinert, Matthias und Ehr, Heiko (2023) Customization of Automatic Speech Recognition Engines for Rare Word Detection Without Costly Model Re-Training. In: 13th SESAR Innovation Days 2023, SIDS 2023. 13th SESAR Innovation Days, 2023-11-27 - 2023-11-30, Sevilla, Spanien. doi: 10.61009/SID.2023.1.10. ISSN 0770-1268.

[img] PDF
3MB

Kurzfassung

Thanks to Alexa, Siri or Google Assistant automatic speech recognition (ASR) has changed our daily life during the last decade. Prototypic applications in the air traffic management (ATM) domain are available. Recently pre-filling radar label entries by ASR support has reached the technology readiness level before industrialization (TRL6). However, seldom spoken and airspace related words relevant in the ATM context remain a challenge for sophisticated applications. Open-source ASR toolkits or large pre-trained models for experts - allowing to tailor ASR to new domains - can be exploited with a typical constraint on availability of certain amount of domain specific training data, i.e., typically transcribed speech for adapting acoustic and/or language models. In general, it is sufficient for a "universal" ASR engine to reliably recognize a few hundred words that form the vocabulary of the voice communications between air traffic controllers and pilots. However, for each airport some hundred dependent words that are seldom spoken need to be integrated. These challenging word entities comprise special airline designators and waypoint names like "dexon" or "burok", which only appear in a specific region. When used, they are highly informative and thus require high recognition accuracies. Allowing plug and play customization with a minimum expert manipulation assumes that no additional training is required, i.e., fine-tuning the universal ASR. This paper presents an innovative approach to automatically integrate new specific word entities to the universal ASR system. The recognition rate of these region-specific word entities with respect to the universal ASR increases by a factor of 6.

elib-URL des Eintrags:https://elib.dlr.de/199971/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Customization of Automatic Speech Recognition Engines for Rare Word Detection Without Costly Model Re-Training
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Bhattacharjee, MrinmoyIdiapNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Motlicek, PetrIdiap, BUTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Nigmatulina, IuliiaIdiap, University of ZurichNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Helmke, HartmutHartmut.Helmke (at) dlr.dehttps://orcid.org/0000-0002-1939-0200NICHT SPEZIFIZIERT
Ohneiser, OliverOliver.Ohneiser (at) dlr.dehttps://orcid.org/0000-0002-5411-691X171650751
Kleinert, MatthiasMatthias.Kleinert (at) dlr.dehttps://orcid.org/0000-0002-0782-4147NICHT SPEZIFIZIERT
Ehr, HeikoHeiko.Ehr (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:28 November 2023
Erschienen in:13th SESAR Innovation Days 2023, SIDS 2023
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
DOI:10.61009/SID.2023.1.10
ISSN:0770-1268
Status:veröffentlicht
Stichwörter:Speech Recognition; Model Adaptation; Integration of prior knowledge; Customization of model, Rare-word integration
Veranstaltungstitel:13th SESAR Innovation Days
Veranstaltungsort:Sevilla, Spanien
Veranstaltungsart:internationale Konferenz
Veranstaltungsbeginn:27 November 2023
Veranstaltungsende:30 November 2023
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Luftfahrt
HGF - Programmthema:Luftverkehr und Auswirkungen
DLR - Schwerpunkt:Luftfahrt
DLR - Forschungsgebiet:L AI - Luftverkehr und Auswirkungen
DLR - Teilgebiet (Projekt, Vorhaben):L - Integrierte Flugführung
Standort: Braunschweig
Institute & Einrichtungen:Institut für Flugführung > Lotsenassistenz
Hinterlegt von: Ohneiser, Oliver
Hinterlegt am:29 Nov 2023 07:34
Letzte Änderung:13 Nov 2024 15:13

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.