Hu, Xuke und Kersten, Jens (2024) Enhancing Toponym Resolution with Fine-Tuned LLMs (Llama2). CEUR Workshop Proceedings. Second International Workshop on Geographic Information Extraction from Texts at ECIR 2024, Glasgow, Scotland.
PDF
681kB |
Offizielle URL: https://ceur-ws.org/Vol-3683
Kurzfassung
In this study, we investigate the use of mid-sized and open-source large language models to enhance the extraction of geographic information from texts, focusing on toponym resolution. Our approach involves fine-tuning Llama2 (7B) to accurately derive the unambiguous references of toponyms within textual contexts and subsequently assign geo-coordinates using geocoders. The method is evaluated on two challenging datasets featuring 28,342 global toponyms. The findings demonstrate notable performance improvements compared to existing state-of-the-art methods while maintaining computational efficiency.
elib-URL des Eintrags: | https://elib.dlr.de/200437/ | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Konferenzbeitrag (Vortrag) | ||||||||||||
Titel: | Enhancing Toponym Resolution with Fine-Tuned LLMs (Llama2) | ||||||||||||
Autoren: |
| ||||||||||||
Datum: | 1 Juli 2024 | ||||||||||||
Referierte Publikation: | Ja | ||||||||||||
Open Access: | Ja | ||||||||||||
Gold Open Access: | Nein | ||||||||||||
In SCOPUS: | Nein | ||||||||||||
In ISI Web of Science: | Nein | ||||||||||||
Verlag: | CEUR Workshop Proceedings | ||||||||||||
Status: | veröffentlicht | ||||||||||||
Stichwörter: | geoparsing, toponym resolution, large language model, Llama2 | ||||||||||||
Veranstaltungstitel: | Second International Workshop on Geographic Information Extraction from Texts at ECIR 2024 | ||||||||||||
Veranstaltungsort: | Glasgow, Scotland | ||||||||||||
Veranstaltungsart: | Workshop | ||||||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||||||
HGF - Programm: | Raumfahrt | ||||||||||||
HGF - Programmthema: | Technik für Raumfahrtsysteme | ||||||||||||
DLR - Schwerpunkt: | Raumfahrt | ||||||||||||
DLR - Forschungsgebiet: | R SY - Technik für Raumfahrtsysteme | ||||||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | R - Big Data und KI für die Entscheidungsunterstützung, D - OpenSearch@DLR | ||||||||||||
Standort: | Jena | ||||||||||||
Institute & Einrichtungen: | Institut für Datenwissenschaften > Datengewinnung und -mobilisierung | ||||||||||||
Hinterlegt von: | Hu, Xuke | ||||||||||||
Hinterlegt am: | 19 Dez 2024 10:31 | ||||||||||||
Letzte Änderung: | 19 Dez 2024 10:31 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags