elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Imprint | Privacy Policy | Contact | Deutsch
Fontsize: [-] Text [+]

Spracherkennung für Flugführungssprechfunk mit dem Deep-Learning-Toolkit CoquiSTT

May, Moritz (2024) Spracherkennung für Flugführungssprechfunk mit dem Deep-Learning-Toolkit CoquiSTT. Bachelor's, Ostfalia Hochschule Braunschweig/Wolfenbüttel.

Full text not available from this repository.

Abstract

Der Sprechfunk zwischen Fluglotsen (Air Traffic Control Operators, ATCOs) und Piloten spielt eine entscheidende Rolle für die sichere und effiziente Navigation von Flugzeugen. Bisher wurde diese Funkkommunikation noch nicht digitalisiert und ist somit nicht für andere Systeme der Lotsen verfügbar. Ein effektives Spracherkennungssystem ist ein großer Schritt, um mehr Automatisierung in die Flugverkehrskontrolle (Air Traffic Control, ATC) zu integrieren. Bereits etablierte Spracherkennungssysteme wie Amazon Alexa, Google Assistant oder auch Siri von Apple eignen sich nicht optimal für die spezielle Phraseologie des ATC-Bereichs, da sie für einen anderen Zweck entwickelt wurden. Des Weiteren handelt es sich bei diesen Spracherkennungssystemen um Lösungen, welche nicht für sprachspezifische Domänen wie zum Beispiel die des Lotsensprechfunks anpassbar sind. Ziel dieser Bachelorarbeit ist es, die Eignung von CoquiSTT, einem Open-Source-Spracherkennungssystem der CoquiAI-Gruppe, als Speech-to-Text-Lösung für ATC-Sprache zu untersuchen. Unterschiedliche Trainingsansätze wie das Training eines Modells mit ausschließlich ATC-Daten und die Anpassung eines Modells, das auf nicht-ATC-Sprache trainiert wurde, wurden untersucht. Die Modellanpassung erfolgte unter Verwendung der Techniken Feintuning und Transferlernen. Während das beste Modell eine Wortfehlerrate (Word Error Rate, WER) von 3,12% erreichen konnte, wurde nicht auf jedem Datensatz eine vergleichbar gute Wortfehlerrate erreicht. Somit kann CoquiSTT als relevante Lösung für bestimmte Aufgaben der automatischen Spracherkennung (Automatic Speech Recognition, ASR) im ATC-Bereich betrachtet werden, ist aber nicht für alle Anwendungsfälle und Daten nutzbar.

Item URL in elib:https://elib.dlr.de/204827/
Document Type:Thesis (Bachelor's)
Title:Spracherkennung für Flugführungssprechfunk mit dem Deep-Learning-Toolkit CoquiSTT
Authors:
AuthorsInstitution or Email of AuthorsAuthor's ORCID iDORCID Put Code
May, MoritzUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Date:2024
Open Access:No
Number of Pages:46
Status:Published
Keywords:Air Traffic Control (ATC), CoquiSTT, Automatic Speech Recognition (ASR)
Institution:Ostfalia Hochschule Braunschweig/Wolfenbüttel
Department:Fakultät Informatik
HGF - Research field:Aeronautics, Space and Transport
HGF - Program:Aeronautics
HGF - Program Themes:Air Transportation and Impact
DLR - Research area:Aeronautics
DLR - Program:L AI - Air Transportation and Impact
DLR - Research theme (Project):L - Integrated Flight Guidance
Location: Braunschweig
Institutes and Institutions:Institute of Flight Guidance > Controller Assistance
Deposited By: Diederich, Kerstin
Deposited On:18 Jun 2024 08:18
Last Modified:18 Jun 2024 08:18

Repository Staff Only: item control page

Browse
Search
Help & Contact
Information
electronic library is running on EPrints 3.3.12
Website and database design: Copyright © German Aerospace Center (DLR). All rights reserved.