Juch, Felix (2021) Verknüpfen von Tweets mit Wissensdatenbanken zur Analyse von Gefahrenereignissen. Bachelor's, Friedrich-Schiller-Universität Jena / DLR Institut für Datenwissenschaften.
PDF
- Only accessible within DLR
1MB |
Abstract
Twitter bietet mit 500 Mio. Tweets täglich ein herausragendes Potenzial zur In- formationsgewinnung über Gefahrenereignisse. Bisherige Ansätze verwenden ausgewählten Katastrophen als Datengrundlage, um die enorme Datenmenge einzuschränken und kostspielige manuelle Annotationen zu vermeiden. Dadurch existiert keine einheitliche Datenbasis für eine Evaluation der entwickelten Methoden. In dieser Arbeit wird ein Verfahren zur Erstellung einer solchen Datenbasis aus- gehend von allen zur Verfügung stehenden Tweets. Über die Identifikation von relevanten Tweets, das Gruppieren dieser anhand der besprochenen Ereignisse und der Validation durch verknüpfen mit frei verfügbaren Datenbanken, wurde ein Datensatz für volcanoes und landslides erstellt. Aufgrund von vorher verwendeten Filtern konnte die ursprüngliche Datenmenge ausreichend eingeschränkt werden, um manuelle Annotationen zu ermöglichen. Es konnten summa summarum 198 Gefahrenereignisse identifiziert, von diesen 20 verifiziert und insgesamt 3938 relevante Tweets ausgezeichnet werden. Damit bietet der Datensatz die Möglichkeit, Methoden der Gefahrenereignisdetektion zu testen und maschinelle Lernverfahren zu trainieren. Diese Verfahren können reaktive und präventive Maßnahmen verbessern und so negativen Auswirkungen reduzieren. Des Weiteren werden damit automatisiert Datensätze generiert, welche eine Grundlage für die Analysen von Gefahrenereignissen bieten. Diese Arbeit dient als Ausgangspunkt für aufbauende Forschungen unter anderem die Überwachung von stattfindenden Ereignissen, die Auswertung von Vorhersagemethoden, Auswirkungsanalysen oder der grundlegenden Evaluation des Potenzials von Twitter Informationsquelle sowie dessen Grenzen.
Item URL in elib: | https://elib.dlr.de/143771/ | ||||||||
---|---|---|---|---|---|---|---|---|---|
Document Type: | Thesis (Bachelor's) | ||||||||
Title: | Verknüpfen von Tweets mit Wissensdatenbanken zur Analyse von Gefahrenereignissen | ||||||||
Authors: |
| ||||||||
Date: | 2021 | ||||||||
Refereed publication: | No | ||||||||
Open Access: | No | ||||||||
Number of Pages: | 39 | ||||||||
Status: | Published | ||||||||
Keywords: | Kriseninformation, Datenbanken, Twitter, annotierter Datensatz | ||||||||
Institution: | Friedrich-Schiller-Universität Jena / DLR Institut für Datenwissenschaften | ||||||||
Department: | Fakultät für Mathematik und Informatik, Softwaretechnik / Bürgerwissenschaften | ||||||||
HGF - Research field: | Aeronautics, Space and Transport | ||||||||
HGF - Program: | Space | ||||||||
HGF - Program Themes: | Space System Technology | ||||||||
DLR - Research area: | Raumfahrt | ||||||||
DLR - Program: | R SY - Space System Technology | ||||||||
DLR - Research theme (Project): | R - Exploration of citizen science methods, R - QS-Project_04 Big-Data-Plattform | ||||||||
Location: | Jena | ||||||||
Institutes and Institutions: | Institute of Data Science > Citizen Science | ||||||||
Deposited By: | Kersten, Dr.-Ing. Jens | ||||||||
Deposited On: | 18 Oct 2021 08:43 | ||||||||
Last Modified: | 30 Nov 2021 14:28 |
Repository Staff Only: item control page