elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Raum-zeitliche und semantische Informationsaggregation mittels Multiview Consensus Clustering

Volkert, Justin (2024) Raum-zeitliche und semantische Informationsaggregation mittels Multiview Consensus Clustering. Masterarbeit, Friedrich-Schiller-Universität Jena / DLR Institute of Data Science.

[img] PDF - Nur DLR-intern zugänglich
2MB

Kurzfassung

Soziale Medien wie Twitter sind als Informationsquelle weit verbreitet. Herkömmliche Ansätze zur Ereigniserkennung umfassen vor allem Ansätze, die sich auf Clustering, Semantik oder neuronale Netze stützen. Clustering ermöglicht es, Muster aus großen Datensätzen zu identifizieren, aber die Ergebnisse können variieren. Daher wurden Ensemble-Algorithmen eingesetzt, um Cluster aus verschiedenen Sichten zu kombinieren und bessere Ergebnisse zu erzielen. Ziel der Arbeit ist es daher, ein Multi-View Clustering zu implementieren und herauszustellen, inwieweit die verschiedenen Views ein robusteres und zuverlässigeres Clustering ermöglichen. In der verwendeten Methode werden zuerst die einzelnen Views erstellt. Anschließend wird für jede Sicht eine individuelle Distanzmetrik erzeugt, auf welche HDBSCAN angewendet wird, um verschiedene Cluster zu erzeugen. Zum Schluss werden daraus Cluster Hypergraphen erzeugt, die zur Ermittlung einer Ähnlichkeitsmatrix dient. Diese wird anschließend verwendet, um die Objekte mithilfe von HDBSCAN erneut zu clustern, was letztendlich zum Consensus-Clustering führt. Dazu wurde vorab der zur Verfügung gestellte DLRGeoTweet-Datensatz aufbereitet und erweitert. Dieser wurde außerdem durch Noise-Injection mit unterschiedlichen Pseudo-Noise Kategorien erweitert, um ein realistischeres Testverfahren zu ermöglichen. Des Weiteren wurde ein Tesframework entwickelt, in welchem verschiedene, zusammengestellte Evaluierungsmetriken miteinander verglichen und deren Zusammenspiel herausgestellt werden kann.

elib-URL des Eintrags:https://elib.dlr.de/210734/
Dokumentart:Hochschulschrift (Masterarbeit)
Titel:Raum-zeitliche und semantische Informationsaggregation mittels Multiview Consensus Clustering
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Volkert, JustinFSU Jena, Professur für GeoinformatikNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:April 2024
Referierte Publikation:Ja
Open Access:Ja
Seitenanzahl:88
Status:nicht veröffentlicht
Stichwörter:Crisis informatics, Disaster Mapping, Earth Observation and Webdata
Institution:Friedrich-Schiller-Universität Jena / DLR Institute of Data Science
Abteilung:Department of GIScience / Data Acquisition and Mobilization (DW-DMO)
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Technik für Raumfahrtsysteme
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R SY - Technik für Raumfahrtsysteme
DLR - Teilgebiet (Projekt, Vorhaben):R - SIDE: Verfahren zur Datengewinnung und -qualitätssicherung für KI-Anwendungen
Standort: Jena
Institute & Einrichtungen:Institut für Datenwissenschaften > Datengewinnung und -mobilisierung
Hinterlegt von: Kersten, Dr.-Ing. Jens
Hinterlegt am:19 Dez 2024 11:24
Letzte Änderung:19 Dez 2024 11:24

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.