elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Evaluation of Provenance Serialisations for Astronomical Provenance

Johnson, Michael A. C. und Paradies, Marcus und Klöckner, Hans-Rainer und Muzafarova, Albina und Champion, David J. und Dembska, Marta und Schindler, Sirko (2024) Evaluation of Provenance Serialisations for Astronomical Provenance. 16th International Workshop on Theory and Practice of Provenance, 2024-07-12, Vienna, Austria. doi: 10.48550/arXiv.2407.14290.

[img] PDF - Nur DLR-intern zugänglich bis 1 August 2025
412kB

Kurzfassung

Provenance data from astronomical pipelines are instrumental in establishing trust and reproducibility in the data processing. In addition, astronomers may also query their provenance to answer questions routed in areas such as anomaly detection, recommendation, and prediction. In order to determine how astronomers should store and query their provenance data, this paper reports on a comparison between the triple store Apache Jena Fuseki and the graph database system Neo4j for this purpose. The metrics measured for comparison were the accuracy and timing of the queries as well as the data upload times. The provenance data used was simulated data that was derived from the provenance describing two astronomical pipelines. It was found that both implementations are competent for this purpose, however Fuseki was more efficient at storing and uploading the data as well as querying over small datasets (<2.5MB). However, Neo4j was more efficient for queries across larger provenance datasets.

elib-URL des Eintrags:https://elib.dlr.de/204103/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Evaluation of Provenance Serialisations for Astronomical Provenance
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Johnson, Michael A. C.michael.johnson-4 (at) manchester.ac.ukhttps://orcid.org/0000-0002-5566-6147NICHT SPEZIFIZIERT
Paradies, MarcusMarcus.Paradies (at) dlr.dehttps://orcid.org/0000-0002-5743-6580NICHT SPEZIFIZIERT
Klöckner, Hans-Rainerhkloeckner (at) mpifr-bonn.mpg.dehttps://orcid.org/0000-0002-0648-2704NICHT SPEZIFIZIERT
Muzafarova, AlbinaBETTA Security GmbHhttps://orcid.org/0000-0002-2282-5105NICHT SPEZIFIZIERT
Champion, David J.champion (at) mpifr-bonn.mpg.dehttps://orcid.org/0000-0003-1361-7723NICHT SPEZIFIZIERT
Dembska, MartaMarta.Dembska (at) dlr.dehttps://orcid.org/0000-0002-8180-1525164281439
Schindler, SirkoSirko.Schindler (at) dlr.dehttps://orcid.org/0000-0002-0964-4457164281442
Datum:Juli 2024
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Nein
In ISI Web of Science:Nein
DOI:10.48550/arXiv.2407.14290
Status:veröffentlicht
Stichwörter:Provenance
Veranstaltungstitel:16th International Workshop on Theory and Practice of Provenance
Veranstaltungsort:Vienna, Austria
Veranstaltungsart:Workshop
Veranstaltungsdatum:12 Juli 2024
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:keine Zuordnung
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R - keine Zuordnung
DLR - Teilgebiet (Projekt, Vorhaben):R - keine Zuordnung
Standort: Jena
Institute & Einrichtungen:Institut für Datenwissenschaften > Datenmanagement und -aufbereitung
Hinterlegt von: Schindler, Dr. Sirko
Hinterlegt am:25 Jul 2024 09:35
Letzte Änderung:25 Jul 2024 09:35

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.