elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Learning to Tag Environmental Sounds in Nightlong Audio

Khan, Mohd Saif (2022) Learning to Tag Environmental Sounds in Nightlong Audio. Masterarbeit, Bauhaus-Universität Weimar / DLR Institut für Datenwissenschaften.

[img] PDF - Nur DLR-intern zugänglich
3MB

Kurzfassung

Environmental sound events are defined as sounds occurring naturally or produced due to human activity. Devices need to identify the environmental sounds for better perception of the environment. The emergence of environmental sound classification using machine learning has led to the development of more context-aware technologies like smart homes, multimedia search, etc. In this thesis, different sound events and their starting and ending times are determined using classification models. The audio data is provided by the German Aerospace Center and is composed of night-long audio clips that are recorded near an airport and contain different environmental sounds. Many challenges like noise in data, sounds of different lengths, and their effects on the classifier are also discussed. We investigated if different models prefer to identify sounds of different lengths in the same audio. An overlapping window approach is devised to improve the identification of starting and ending times of the predicted events. The results of the thesis are encouraging as the best model is able to identify various sound events with an accuracy of 0.94 on a balanced dataset of 4 different classes. Finally, a system is also conceptualized where the environmental sounds are identified, and their spans are visualized against time.

elib-URL des Eintrags:https://elib.dlr.de/188886/
Dokumentart:Hochschulschrift (Masterarbeit)
Titel:Learning to Tag Environmental Sounds in Nightlong Audio
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Khan, Mohd SaifBauhaus-Universität WeimarNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:2022
Referierte Publikation:Ja
Open Access:Ja
Seitenanzahl:54
Status:veröffentlicht
Stichwörter:Audio Analysis, Environmental Sound Classification
Institution:Bauhaus-Universität Weimar / DLR Institut für Datenwissenschaften
Abteilung:Faculty of Media / Datengewinnung und -mobilisierung
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Technik für Raumfahrtsysteme
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R SY - Technik für Raumfahrtsysteme
DLR - Teilgebiet (Projekt, Vorhaben):R - Umwelt, Gesundheit und Big Data
Standort: Jena
Institute & Einrichtungen:Institut für Datenwissenschaften > Datengewinnung und -mobilisierung
Hinterlegt von: Kersten, Dr.-Ing. Jens
Hinterlegt am:02 Nov 2022 11:34
Letzte Änderung:11 Nov 2022 12:38

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.