elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Spracherkennung für Flugführungssprechfunk mit dem Deep-Learning-Toolkit CoquiSTT

May, Moritz (2024) Spracherkennung für Flugführungssprechfunk mit dem Deep-Learning-Toolkit CoquiSTT. Bachelorarbeit, Ostfalia Hochschule Braunschweig/Wolfenbüttel.

Dieses Archiv kann nicht den Volltext zur Verfügung stellen.

Kurzfassung

Der Sprechfunk zwischen Fluglotsen (Air Traffic Control Operators, ATCOs) und Piloten spielt eine entscheidende Rolle für die sichere und effiziente Navigation von Flugzeugen. Bisher wurde diese Funkkommunikation noch nicht digitalisiert und ist somit nicht für andere Systeme der Lotsen verfügbar. Ein effektives Spracherkennungssystem ist ein großer Schritt, um mehr Automatisierung in die Flugverkehrskontrolle (Air Traffic Control, ATC) zu integrieren. Bereits etablierte Spracherkennungssysteme wie Amazon Alexa, Google Assistant oder auch Siri von Apple eignen sich nicht optimal für die spezielle Phraseologie des ATC-Bereichs, da sie für einen anderen Zweck entwickelt wurden. Des Weiteren handelt es sich bei diesen Spracherkennungssystemen um Lösungen, welche nicht für sprachspezifische Domänen wie zum Beispiel die des Lotsensprechfunks anpassbar sind. Ziel dieser Bachelorarbeit ist es, die Eignung von CoquiSTT, einem Open-Source-Spracherkennungssystem der CoquiAI-Gruppe, als Speech-to-Text-Lösung für ATC-Sprache zu untersuchen. Unterschiedliche Trainingsansätze wie das Training eines Modells mit ausschließlich ATC-Daten und die Anpassung eines Modells, das auf nicht-ATC-Sprache trainiert wurde, wurden untersucht. Die Modellanpassung erfolgte unter Verwendung der Techniken Feintuning und Transferlernen. Während das beste Modell eine Wortfehlerrate (Word Error Rate, WER) von 3,12% erreichen konnte, wurde nicht auf jedem Datensatz eine vergleichbar gute Wortfehlerrate erreicht. Somit kann CoquiSTT als relevante Lösung für bestimmte Aufgaben der automatischen Spracherkennung (Automatic Speech Recognition, ASR) im ATC-Bereich betrachtet werden, ist aber nicht für alle Anwendungsfälle und Daten nutzbar.

elib-URL des Eintrags:https://elib.dlr.de/204827/
Dokumentart:Hochschulschrift (Bachelorarbeit)
Titel:Spracherkennung für Flugführungssprechfunk mit dem Deep-Learning-Toolkit CoquiSTT
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
May, Moritzmoritz.may (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:2024
Open Access:Nein
Seitenanzahl:46
Status:veröffentlicht
Stichwörter:Air Traffic Control (ATC), CoquiSTT, Automatic Speech Recognition (ASR)
Institution:Ostfalia Hochschule Braunschweig/Wolfenbüttel
Abteilung:Fakultät Informatik
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Luftfahrt
HGF - Programmthema:Luftverkehr und Auswirkungen
DLR - Schwerpunkt:Luftfahrt
DLR - Forschungsgebiet:L AI - Luftverkehr und Auswirkungen
DLR - Teilgebiet (Projekt, Vorhaben):L - Integrierte Flugführung
Standort: Braunschweig
Institute & Einrichtungen:Institut für Flugführung > Lotsenassistenz
Hinterlegt von: Diederich, Kerstin
Hinterlegt am:18 Jun 2024 08:18
Letzte Änderung:18 Jun 2024 08:18

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.