Volkert, Justin (2024) Raum-zeitliche und semantische Informationsaggregation mittels Multiview Consensus Clustering. Masterarbeit, Friedrich-Schiller-Universität Jena / DLR Institute of Data Science.
PDF
- Nur DLR-intern zugänglich
2MB |
Kurzfassung
Soziale Medien wie Twitter sind als Informationsquelle weit verbreitet. Herkömmliche Ansätze zur Ereigniserkennung umfassen vor allem Ansätze, die sich auf Clustering, Semantik oder neuronale Netze stützen. Clustering ermöglicht es, Muster aus großen Datensätzen zu identifizieren, aber die Ergebnisse können variieren. Daher wurden Ensemble-Algorithmen eingesetzt, um Cluster aus verschiedenen Sichten zu kombinieren und bessere Ergebnisse zu erzielen. Ziel der Arbeit ist es daher, ein Multi-View Clustering zu implementieren und herauszustellen, inwieweit die verschiedenen Views ein robusteres und zuverlässigeres Clustering ermöglichen. In der verwendeten Methode werden zuerst die einzelnen Views erstellt. Anschließend wird für jede Sicht eine individuelle Distanzmetrik erzeugt, auf welche HDBSCAN angewendet wird, um verschiedene Cluster zu erzeugen. Zum Schluss werden daraus Cluster Hypergraphen erzeugt, die zur Ermittlung einer Ähnlichkeitsmatrix dient. Diese wird anschließend verwendet, um die Objekte mithilfe von HDBSCAN erneut zu clustern, was letztendlich zum Consensus-Clustering führt. Dazu wurde vorab der zur Verfügung gestellte DLRGeoTweet-Datensatz aufbereitet und erweitert. Dieser wurde außerdem durch Noise-Injection mit unterschiedlichen Pseudo-Noise Kategorien erweitert, um ein realistischeres Testverfahren zu ermöglichen. Des Weiteren wurde ein Tesframework entwickelt, in welchem verschiedene, zusammengestellte Evaluierungsmetriken miteinander verglichen und deren Zusammenspiel herausgestellt werden kann.
elib-URL des Eintrags: | https://elib.dlr.de/210734/ | ||||||||
---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Hochschulschrift (Masterarbeit) | ||||||||
Titel: | Raum-zeitliche und semantische Informationsaggregation mittels Multiview Consensus Clustering | ||||||||
Autoren: |
| ||||||||
Datum: | April 2024 | ||||||||
Referierte Publikation: | Ja | ||||||||
Open Access: | Ja | ||||||||
Seitenanzahl: | 88 | ||||||||
Status: | nicht veröffentlicht | ||||||||
Stichwörter: | Crisis informatics, Disaster Mapping, Earth Observation and Webdata | ||||||||
Institution: | Friedrich-Schiller-Universität Jena / DLR Institute of Data Science | ||||||||
Abteilung: | Department of GIScience / Data Acquisition and Mobilization (DW-DMO) | ||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||
HGF - Programm: | Raumfahrt | ||||||||
HGF - Programmthema: | Technik für Raumfahrtsysteme | ||||||||
DLR - Schwerpunkt: | Raumfahrt | ||||||||
DLR - Forschungsgebiet: | R SY - Technik für Raumfahrtsysteme | ||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | R - SIDE: Verfahren zur Datengewinnung und -qualitätssicherung für KI-Anwendungen | ||||||||
Standort: | Jena | ||||||||
Institute & Einrichtungen: | Institut für Datenwissenschaften > Datengewinnung und -mobilisierung | ||||||||
Hinterlegt von: | Kersten, Dr.-Ing. Jens | ||||||||
Hinterlegt am: | 19 Dez 2024 11:24 | ||||||||
Letzte Änderung: | 19 Dez 2024 11:24 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags