elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Barrierefreiheit | Kontakt | English
Schriftgröße: [-] Text [+]

FoxBench: Benchmark for n-Dimensional Array File Formats in Data Analytics Environments

Osterthun, Arne und Pohl, Matthias (2025) FoxBench: Benchmark for n-Dimensional Array File Formats in Data Analytics Environments. GI. Datenbanksysteme für Business, Technologie und Web (BTW 2025), 2025-03-03 - 2025-03-07, Bamberg, Germany. doi: 10.18420/BTW2025-25.

[img] PDF
369kB

Kurzfassung

For effective data exchange and transfer, choosing the right file format is crucial. Different domains have specific standards for file formats. While CSV files are commonly used, they lack reusability. Data files are well-suited for computing clusters. Data analytics pipelines can be time-consuming due to handling large volumes of data. Timely data access is crucial for efficient processing and analysis. Earth system science (ESS) data commonly manifests as dense or sparse n-dimensional data. Dense n-dimensional data is conventionally stored in arrays, while sparse n-dimensional data is typically housed in data frames. In the realm of ESS, an array of file formats is leveraged for the storage of dense n-dimensional data, including NetCDF4, TileDB, and Zarr. The paper at hand aims to evaluate data file formats for retrieving multidimensional data, specifically focusing on tools within the ESS domain. The insights from this exploration will be applicable to other data analytics projects.

elib-URL des Eintrags:https://elib.dlr.de/219246/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:FoxBench: Benchmark for n-Dimensional Array File Formats in Data Analytics Environments
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Osterthun, Arnearne.osterthun (at) dlr.dehttps://orcid.org/0000-0001-6455-9119NICHT SPEZIFIZIERT
Pohl, Matthiasmatthias.pohl (at) dlr.dehttps://orcid.org/0000-0002-6241-7675NICHT SPEZIFIZIERT
Datum:7 März 2025
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Nein
In ISI Web of Science:Nein
Band:361
DOI:10.18420/BTW2025-25
Verlag:GI
Name der Reihe:Lecture Notes of Informatics
Status:veröffentlicht
Stichwörter:Benchmark, Data Access, Storage, Cost-based Valuation, File Formats, Big Data
Veranstaltungstitel:Datenbanksysteme für Business, Technologie und Web (BTW 2025)
Veranstaltungsort:Bamberg, Germany
Veranstaltungsart:internationale Konferenz
Veranstaltungsbeginn:3 März 2025
Veranstaltungsende:7 März 2025
Veranstalter :GI
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:keine Zuordnung
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R - keine Zuordnung
DLR - Teilgebiet (Projekt, Vorhaben):R - keine Zuordnung
Standort: Jena
Institute & Einrichtungen:Institut für Datenwissenschaften > Datenmanagement und -aufbereitung
Hinterlegt von: Pohl, Matthias
Hinterlegt am:19 Nov 2025 08:18
Letzte Änderung:19 Nov 2025 10:59

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
OpenAIRE Validator logo electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.