elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Combining Supervised and Unsupervised Learning to Detect and Semantically Aggregate Crisis-Related Twitter Content

Kersten, Jens und Bongard, Jan und Klan, Friederike (2021) Combining Supervised and Unsupervised Learning to Detect and Semantically Aggregate Crisis-Related Twitter Content. In: 18th International Conference on Information Systems for Crisis Response and Management, ISCRAM 2021, Seiten 744-754. ISCRAM 2021, 2021-05, Blacksburg, VA, USA / online. ISBN 978-194937361-5. ISSN 2411-3387.

[img] PDF
2MB

Offizielle URL: http://idl.iscram.org/search.php?sqlQuery=SELECT%20author%2C%20title%2C%20type%2C%20year%2C%20publication%2C%20abbrev_journal%2C%20volume%2C%20issue%2C%20pages%2C%20keywords%2C%20abstract%2C%20address%2C%20corporate_author%2C%20thesis%2C%20publisher%2C%20

Kurzfassung

Twitter is an immediate and almost ubiquitous platform and therefore can be a valuable source of information during disasters. Current methods for identifying and classifying crisis-related content are often based on single tweets, i.e., already known information from the past is neglected. In this paper, the combination of tweet-wise pre-trained neural networks and unsupervised semantic clustering is proposed and investigated. The intention is to (1) enhance the generalization capability of pre-trained models, (2) to be able to handle massive amounts of stream data, (3) to reduce information overload by identifying potentially crisis-related content, and (4) to obtain a semantically aggregated data representation that allows for further automated, manual and visual analyses. Latent representations of each tweet based on pre-trained sentence embedding models are used for both, clustering and tweet classification. For a fast, robust and time-continuous processing, subsequent time periods are clustered individually according to a Chinese restaurant process. Clusters without any tweet classified as crisis-related are pruned. Data aggregation over time is ensured by merging semantically similar clusters. A comparison of our hybrid method to a similar clustering approach, as well as first quantitative and qualitative results from experiments with two different labeled data sets demonstrate the great potential for crisis-related Twitter stream analyses.

elib-URL des Eintrags:https://elib.dlr.de/143774/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Combining Supervised and Unsupervised Learning to Detect and Semantically Aggregate Crisis-Related Twitter Content
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Kersten, Jensjens.kersten (at) dlr.dehttps://orcid.org/0000-0002-4735-7360NICHT SPEZIFIZIERT
Bongard, JanJan.Bongard (at) dlr.dehttps://orcid.org/0000-0001-9453-7391NICHT SPEZIFIZIERT
Klan, FriederikeFriederike.Klan (at) dlr.dehttps://orcid.org/0000-0002-1856-7334NICHT SPEZIFIZIERT
Datum:Mai 2021
Erschienen in:18th International Conference on Information Systems for Crisis Response and Management, ISCRAM 2021
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
Seitenbereich:Seiten 744-754
Herausgeber:
HerausgeberInstitution und/oder E-Mail-Adresse der HerausgeberHerausgeber-ORCID-iDORCID Put Code
Adrot, AnouckNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Grace, RobNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Moore, KathleenNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Zobel, ChristopherNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Name der Reihe:Proceedings of the 18th ISCRAM Conference
ISSN:2411-3387
ISBN:978-194937361-5
Status:veröffentlicht
Stichwörter:Information Overload Reduction, Semantic Clustering, Crisis Informatics, Twitter Stream
Veranstaltungstitel:ISCRAM 2021
Veranstaltungsort:Blacksburg, VA, USA / online
Veranstaltungsart:internationale Konferenz
Veranstaltungsdatum:Mai 2021
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Technik für Raumfahrtsysteme
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R SY - Technik für Raumfahrtsysteme
DLR - Teilgebiet (Projekt, Vorhaben):R - Erforschung Bürgerwissenschaftlicher Methoden, R - QS-Projekt_04 Big-Data-Plattform
Standort: Jena
Institute & Einrichtungen:Institut für Datenwissenschaften > Bürgerwissenschaften
Hinterlegt von: Kersten, Dr.-Ing. Jens
Hinterlegt am:18 Okt 2021 08:22
Letzte Änderung:24 Apr 2024 20:43

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.