elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Barrierefreiheit | Kontakt | English
Schriftgröße: [-] Text [+]

Automatic Speech Recognition in the Cockpit: A Comparative Study of ASR Models for Pilot Communication

Ternus, Sarah und Nareddy, Kartheek Kumar Reddy und Niebling, Julia und Papenfuß, Anne (2025) Automatic Speech Recognition in the Cockpit: A Comparative Study of ASR Models for Pilot Communication. DLRK 2025, 2025-09-23 - 2025-09-25, Augsburg, Deutschland. doi: 10.25967/650258.

[img] PDF
418kB

Kurzfassung

Automatic Speech Recognition (ASR) has seen significant advances in aviation, particularly in Air Traffic Control (ATC), however intra-cockpit communication between pilots has remained largely unexplored despite its central role in teamwork and decision-making. This paper takes an application-oriented perspective and examines how openly available state-of-the-art ASR models perform when applied to intra-cockpit communication without any domain-specific adaptation. We evaluate OpenAI’s Whisper (Large-v3 and turbo variant), Wav2Vec2-XLSR-53 as a base model with fine-tuned English, German and multilingual versions, and Meta’s Massively Multilingual Speech (MMS) model. Using a dataset of 409 manually transcribed speech segments collected from simulator flights, this paper classifies cockpit communication into six categories and assess performance using Word Error Rate (WER) for each model and category. Results show that Whisper Large consistently achieves the lowest average error rates and demonstrates strong multilingual handling, though it is prone to outliers and occasional hallucinations. Wav2Vec-based models, while less accurate overall, avoid generative errors, with monolingual fine-tuned models working better in language-specific contexts and multilingual variants being able to adapt to code-switching in some cases. The findings highlight trade-offs between consistency, multilingual capability, and computational work, and point to the potential of domain-specific fine-tuning, as this enables improvements in specialized terminology handling. These insights provide a foundation for applying ASR to cockpit communication in both human factors research and future Human-AI Teaming (HAT) applications.

elib-URL des Eintrags:https://elib.dlr.de/219140/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Automatic Speech Recognition in the Cockpit: A Comparative Study of ASR Models for Pilot Communication
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Ternus, Sarahsarah.ternus (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Nareddy, Kartheek Kumar Reddykartheek.nareddy (at) dlr.dehttps://orcid.org/0000-0003-4586-5158NICHT SPEZIFIZIERT
Niebling, JuliaJulia.Niebling (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Papenfuß, AnneAnne.Papenfuss (at) dlr.dehttps://orcid.org/0000-0002-0686-7006NICHT SPEZIFIZIERT
Datum:7 November 2025
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Nein
In ISI Web of Science:Nein
DOI:10.25967/650258
Status:veröffentlicht
Stichwörter:Automatic Speech Recognition, Cockpit Communication, Human-AI Teaming
Veranstaltungstitel:DLRK 2025
Veranstaltungsort:Augsburg, Deutschland
Veranstaltungsart:nationale Konferenz
Veranstaltungsbeginn:23 September 2025
Veranstaltungsende:25 September 2025
Veranstalter :Deutsche Gesellschaft für Luft- und Raumfahrt (DGLR)
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Luftfahrt
HGF - Programmthema:Luftverkehr und Auswirkungen
DLR - Schwerpunkt:Luftfahrt
DLR - Forschungsgebiet:L AI - Luftverkehr und Auswirkungen
DLR - Teilgebiet (Projekt, Vorhaben):L - Faktor Mensch, R - Synergieprojekt DLR Foundation Models [SY]
Standort: Braunschweig , Jena
Institute & Einrichtungen:Institut für Flugführung > Systemergonomie
Institut für Datenwissenschaften > Datenanalyse und -intelligenz
Hinterlegt von: Ternus, Sarah
Hinterlegt am:20 Nov 2025 10:14
Letzte Änderung:20 Nov 2025 10:14

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
OpenAIRE Validator logo electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.