Hu, Xuke und Kersten, Jens (2024) Enhancing Toponym Resolution with Fine-Tuned LLMs (Llama2). CEUR Workshop Proceedings. Second International Workshop on Geographic Information Extraction from Texts at ECIR 2024, Glasgow, Scotland.
|
PDF
681kB |
Offizielle URL: https://ceur-ws.org/Vol-3683
Kurzfassung
In this study, we investigate the use of mid-sized and open-source large language models to enhance the extraction of geographic information from texts, focusing on toponym resolution. Our approach involves fine-tuning Llama2 (7B) to accurately derive the unambiguous references of toponyms within textual contexts and subsequently assign geo-coordinates using geocoders. The method is evaluated on two challenging datasets featuring 28,342 global toponyms. The findings demonstrate notable performance improvements compared to existing state-of-the-art methods while maintaining computational efficiency.
| elib-URL des Eintrags: | https://elib.dlr.de/200437/ | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Dokumentart: | Konferenzbeitrag (Vortrag) | ||||||||||||
| Titel: | Enhancing Toponym Resolution with Fine-Tuned LLMs (Llama2) | ||||||||||||
| Autoren: |
| ||||||||||||
| Datum: | 1 Juli 2024 | ||||||||||||
| Referierte Publikation: | Ja | ||||||||||||
| Open Access: | Ja | ||||||||||||
| Gold Open Access: | Nein | ||||||||||||
| In SCOPUS: | Nein | ||||||||||||
| In ISI Web of Science: | Nein | ||||||||||||
| Verlag: | CEUR Workshop Proceedings | ||||||||||||
| Status: | veröffentlicht | ||||||||||||
| Stichwörter: | geoparsing, toponym resolution, large language model, Llama2 | ||||||||||||
| Veranstaltungstitel: | Second International Workshop on Geographic Information Extraction from Texts at ECIR 2024 | ||||||||||||
| Veranstaltungsort: | Glasgow, Scotland | ||||||||||||
| Veranstaltungsart: | Workshop | ||||||||||||
| HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||||||
| HGF - Programm: | Raumfahrt | ||||||||||||
| HGF - Programmthema: | Technik für Raumfahrtsysteme | ||||||||||||
| DLR - Schwerpunkt: | Raumfahrt | ||||||||||||
| DLR - Forschungsgebiet: | R SY - Technik für Raumfahrtsysteme | ||||||||||||
| DLR - Teilgebiet (Projekt, Vorhaben): | R - Big Data und KI für die Entscheidungsunterstützung, D - OpenSearch@DLR | ||||||||||||
| Standort: | Jena | ||||||||||||
| Institute & Einrichtungen: | Institut für Datenwissenschaften > Datengewinnung und -mobilisierung | ||||||||||||
| Hinterlegt von: | Hu, Xuke | ||||||||||||
| Hinterlegt am: | 19 Dez 2024 10:31 | ||||||||||||
| Letzte Änderung: | 19 Dez 2024 10:31 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags