elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

BERTRAFFIC: BERT-BASED JOINT SPEAKER ROLE AND SPEAKER CHANGE DETECTION FOR AIR TRAFFIC CONTROL COMMUNICATIONS

Zuluaga-Gomez, Juan Pablo und Sarfjoo, Saeed Seyyed und Prasad, Amrutha und Nigmatulina, Iuliia und Motlicek, Petr und Ondřej, Karel und Ohneiser, Oliver und Helmke, Hartmut (2023) BERTRAFFIC: BERT-BASED JOINT SPEAKER ROLE AND SPEAKER CHANGE DETECTION FOR AIR TRAFFIC CONTROL COMMUNICATIONS. In: 2022 IEEE Spoken Language Technology Workshop, SLT 2022 - Proceedings. The 2022 IEEE Spoken Language Workshop Technology Workshop (SLT 2022), 09.-12. Jan. 2023, Doha, Qatar. doi: 10.1109/SLT54892.2023.10022718. ISBN 979-835039690-4. ISSN 2639-5479.

[img] PDF
441kB

Kurzfassung

Automatic speech recognition (ASR) allows transcribing the communications between air traffic controllers (ATCOs) and aircraft pilots. The transcriptions are used later to extract ATC named entities, e.g., aircraft callsigns. One common challenge is speech activity detection (SAD) and speaker diarization (SD). In the failure condition, two or more segments remain in the same recording, jeopardizing the overall performance. We propose a system that combines SAD and a BERT model to perform speaker change detection and speaker role detection (SRD) by chunking ASR transcripts, i.e., SD with a defined number of speakers together with SRD. The proposed model is evaluated on real-life public ATC databases. Our BERT SD model baseline reaches up to 10% and 20% token-based Jaccard error rate (JER) in public and private ATC databases. We also achieved relative improvements of 32% and 7.7% in JERs and SD error rat

elib-URL des Eintrags:https://elib.dlr.de/189419/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:BERTRAFFIC: BERT-BASED JOINT SPEAKER ROLE AND SPEAKER CHANGE DETECTION FOR AIR TRAFFIC CONTROL COMMUNICATIONS
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Zuluaga-Gomez, Juan PabloIdiap, EPFLNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Sarfjoo, Saeed SeyyedIdiapNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Prasad, AmruthaAmrutha.Prasad (at) idiap.chNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Nigmatulina, IuliiaIdiapNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Motlicek, PetrPetr.Motlicek (at) idiap.chNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Ondřej, KarelBUT, Brno, Czech RepulicNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Ohneiser, OliverOliver.Ohneiser (at) dlr.dehttps://orcid.org/0000-0002-5411-691XNICHT SPEZIFIZIERT
Helmke, HartmutHartmut.Helmke (at) dlr.dehttps://orcid.org/0000-0002-1939-0200NICHT SPEZIFIZIERT
Datum:2023
Erschienen in:2022 IEEE Spoken Language Technology Workshop, SLT 2022 - Proceedings
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Ja
DOI:10.1109/SLT54892.2023.10022718
ISSN:2639-5479
ISBN:979-835039690-4
Status:veröffentlicht
Stichwörter:Text-based speaker diarization, speaker change detection, speaker role detection, air traffic control communications, chunking
Veranstaltungstitel:The 2022 IEEE Spoken Language Workshop Technology Workshop (SLT 2022)
Veranstaltungsort:Doha, Qatar
Veranstaltungsart:internationale Konferenz
Veranstaltungsdatum:09.-12. Jan. 2023
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Luftfahrt
HGF - Programmthema:Luftverkehr und Auswirkungen
DLR - Schwerpunkt:Luftfahrt
DLR - Forschungsgebiet:L AI - Luftverkehr und Auswirkungen
DLR - Teilgebiet (Projekt, Vorhaben):L - Integrierte Flugführung
Standort: Braunschweig
Institute & Einrichtungen:Institut für Flugführung > Lotsenassistenz
Hinterlegt von: Diederich, Kerstin
Hinterlegt am:22 Feb 2023 10:02
Letzte Änderung:29 Nov 2023 11:21

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.