elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Ambient Sound Helps: Audiovisual Crowd Counting in Extreme Conditions

Di, Hu und Mou, LiChao und Wang, Qingzhong und Gao, Junyu und Hua, Yuansheng und Dou, Dejing und Zhu, Xiao Xiang (2020) Ambient Sound Helps: Audiovisual Crowd Counting in Extreme Conditions. In: Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), Seiten 1-4. IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), 2020-06-14 - 2020-06-19, Virtual event.

[img] PDF
3MB

Offizielle URL: http://sightsound.org/papers/2020/Di_Hu_Does_Ambient_Sound_Help_Audiovisual_Crowd_Counting.pdf

Kurzfassung

Visual crowd counting has been recently studied as a way to enable people counting in crowd scenes from images. Albeit successful, vision-based crowd counting approaches could fail to capture informative features in extreme conditions, e.g., imaging at night and occlusion. In this work, we introduce a novel task of audiovisual crowd counting, in which visual and auditory information are integrated for counting purposes. We collect a large-scale benchmark, named auDiovISual Crowd cOunting (DISCO) dataset, consisting of 1,935 images and the corresponding audio clips, and 170,270 annotated instances. In order to fuse the two modalities, we make use of a linear feature-wise fusion module that carries out an affine transformation on visual and auditory features. Finally, we conduct extensive experiments using the proposed dataset and approach. Experimental results show that introducing auditory information can benefit crowd counting under different illumination, noise, and occlusion conditions. The dataset and code will be released. Code and data have been made available

elib-URL des Eintrags:https://elib.dlr.de/141044/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Ambient Sound Helps: Audiovisual Crowd Counting in Extreme Conditions
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Di, HuNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Mou, LiChaoLiChao.Mou (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Wang, QingzhongNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Gao, JunyuNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Hua, YuanshengYuansheng.Hua (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Dou, DejingNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Zhu, Xiao Xiangxiao.zhu (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:Juni 2020
Erschienen in:Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW)
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Nein
In ISI Web of Science:Nein
Seitenbereich:Seiten 1-4
Status:veröffentlicht
Stichwörter:audiovisual crowd, extreme conditions, ambient sound
Veranstaltungstitel:IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW)
Veranstaltungsort:Virtual event
Veranstaltungsart:internationale Konferenz
Veranstaltungsbeginn:14 Juni 2020
Veranstaltungsende:19 Juni 2020
Veranstalter :IEEE
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Erdbeobachtung
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R EO - Erdbeobachtung
DLR - Teilgebiet (Projekt, Vorhaben):R - Fernerkundung u. Geoforschung
Standort: Oberpfaffenhofen
Institute & Einrichtungen:Institut für Methodik der Fernerkundung > EO Data Science
Hinterlegt von: Bratasanu, Ion-Dragos
Hinterlegt am:25 Feb 2021 11:54
Letzte Änderung:24 Apr 2024 20:41

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.