May, Moritz (2024) Spracherkennung für Flugführungssprechfunk mit dem Deep-Learning-Toolkit CoquiSTT. Bachelorarbeit, Ostfalia Hochschule Braunschweig/Wolfenbüttel.
Dieses Archiv kann nicht den Volltext zur Verfügung stellen.
Kurzfassung
Der Sprechfunk zwischen Fluglotsen (Air Traffic Control Operators, ATCOs) und Piloten spielt eine entscheidende Rolle für die sichere und effiziente Navigation von Flugzeugen. Bisher wurde diese Funkkommunikation noch nicht digitalisiert und ist somit nicht für andere Systeme der Lotsen verfügbar. Ein effektives Spracherkennungssystem ist ein großer Schritt, um mehr Automatisierung in die Flugverkehrskontrolle (Air Traffic Control, ATC) zu integrieren. Bereits etablierte Spracherkennungssysteme wie Amazon Alexa, Google Assistant oder auch Siri von Apple eignen sich nicht optimal für die spezielle Phraseologie des ATC-Bereichs, da sie für einen anderen Zweck entwickelt wurden. Des Weiteren handelt es sich bei diesen Spracherkennungssystemen um Lösungen, welche nicht für sprachspezifische Domänen wie zum Beispiel die des Lotsensprechfunks anpassbar sind. Ziel dieser Bachelorarbeit ist es, die Eignung von CoquiSTT, einem Open-Source-Spracherkennungssystem der CoquiAI-Gruppe, als Speech-to-Text-Lösung für ATC-Sprache zu untersuchen. Unterschiedliche Trainingsansätze wie das Training eines Modells mit ausschließlich ATC-Daten und die Anpassung eines Modells, das auf nicht-ATC-Sprache trainiert wurde, wurden untersucht. Die Modellanpassung erfolgte unter Verwendung der Techniken Feintuning und Transferlernen. Während das beste Modell eine Wortfehlerrate (Word Error Rate, WER) von 3,12% erreichen konnte, wurde nicht auf jedem Datensatz eine vergleichbar gute Wortfehlerrate erreicht. Somit kann CoquiSTT als relevante Lösung für bestimmte Aufgaben der automatischen Spracherkennung (Automatic Speech Recognition, ASR) im ATC-Bereich betrachtet werden, ist aber nicht für alle Anwendungsfälle und Daten nutzbar
elib-URL des Eintrags: | https://elib.dlr.de/205585/ | ||||||||
---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Hochschulschrift (Bachelorarbeit) | ||||||||
Titel: | Spracherkennung für Flugführungssprechfunk mit dem Deep-Learning-Toolkit CoquiSTT | ||||||||
Autoren: |
| ||||||||
Datum: | 2024 | ||||||||
Open Access: | Nein | ||||||||
Seitenanzahl: | 46 | ||||||||
Status: | veröffentlicht | ||||||||
Stichwörter: | Air Traffic Control (ATC), CoquiSTT, Automatic Speech Recognition (ASR) | ||||||||
Institution: | Ostfalia Hochschule Braunschweig/Wolfenbüttel | ||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||
HGF - Programm: | Luftfahrt | ||||||||
HGF - Programmthema: | Luftverkehr und Auswirkungen | ||||||||
DLR - Schwerpunkt: | Luftfahrt | ||||||||
DLR - Forschungsgebiet: | L AI - Luftverkehr und Auswirkungen | ||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | L - Integrierte Flugführung | ||||||||
Standort: | Braunschweig | ||||||||
Institute & Einrichtungen: | Institut für Flugführung > Lotsenassistenz | ||||||||
Hinterlegt von: | Diederich, Kerstin | ||||||||
Hinterlegt am: | 12 Sep 2024 09:47 | ||||||||
Letzte Änderung: | 12 Sep 2024 09:47 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags