elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

DAPHNE: An Open and Extensible System Infrastructure for Integrated Data Analysis Pipelines

Damme, Patrick und Birkenbach, Marius und Bitsakos, Constantinos und Boehm, Matthias und Bonnet, Philippe und Ciorba, Florina M. und Dokter, Mark und Dowgiallo, Pawel und Eleliemy, Ahmed und Faerber, Christian und Goumas, Georgios I. und Habich, Dirk und Hedam, Niclas und Hofer, Marlies und Huang, Wenjun und Innerebner, Kevin und Karakostas, Vasileios und Kern, Roman und Kosar, Tomaz und Krause, Alexander und Krems, Daniel und Laber, Andreas und Lehner, Wolfgang und Mier, Eric und Paradies, Marcus und Peischl, Bernhard und Poerwawinata, Gabrielle und Psomadakis, Stratos und Rabl, Tilmann und Ratuszniak, Piotr und Silva, Pedro und Skuppin, Nikolai und Starzacher, Andreas und Steinwender, Benjamin und Tolovski, Ilin und Tözün, Pinar und Ulatowski, Wojciech und Wang, Yuanyuan und Wrosz, Izajasz P. und Zamuda, Ales und Zhang, Ce und Zhu, Xiaoxiang (2022) DAPHNE: An Open and Extensible System Infrastructure for Integrated Data Analysis Pipelines. In: 12th Annual Conference on Innovative Data Systems Research, CIDR 2022. CIDR 2022, Chaminade, US.

Dieses Archiv kann nicht den Volltext zur Verfügung stellen.

Kurzfassung

Integrated data analysis (IDA) pipelines—that combine data management (DM) and query processing, high-performance computing (HPC), and machine learning (ML) training and scoring—become increasingly common in practice. Interestingly, systems of these areas share many compilation and runtime techniques, and the used—increasingly heterogeneous—hardware infrastructure converges as well. Yet, the programming paradigms, cluster resource management, data formats and representations, as well as execution strategies differ substantially. DAPHNE is an open and extensible system infrastructure for such IDA pipelines, including language abstractions, compilation and runtime techniques, multi-level scheduling, hardware (HW) accelerators, and computational storage for increasing productivity and eliminating unnecessary overheads. In this paper, we make a case for IDA pipelines, describe the overall DAPHNE system architecture, its key components, and the design of a vectorized execution engine for computational storage, HW accelerators, as well as local and distributed operations. Preliminary experiments that compare DAPHNE with MonetDB, Pandas, DuckDB, and TensorFlow show promising results.

elib-URL des Eintrags:https://elib.dlr.de/189734/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:DAPHNE: An Open and Extensible System Infrastructure for Integrated Data Analysis Pipelines
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Damme, PatrickNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Birkenbach, MariusNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Bitsakos, ConstantinosNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Boehm, MatthiasNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Bonnet, PhilippeNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Ciorba, Florina M.NICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Dokter, MarkNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Dowgiallo, PawelNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Eleliemy, AhmedNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Faerber, ChristianNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Goumas, Georgios I.NICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Habich, DirkNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Hedam, NiclasNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Hofer, MarliesNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Huang, WenjunNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Innerebner, KevinNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Karakostas, VasileiosNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Kern, RomanNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Kosar, TomazNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Krause, AlexanderNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Krems, DanielNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Laber, AndreasNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Lehner, WolfgangNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Mier, EricNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Paradies, MarcusMarcus.Paradies (at) dlr.dehttps://orcid.org/0000-0002-5743-6580NICHT SPEZIFIZIERT
Peischl, BernhardNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Poerwawinata, GabrielleNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Psomadakis, StratosNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Rabl, TilmannNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Ratuszniak, PiotrNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Silva, PedroNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Skuppin, NikolaiNikolai.Skuppin (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Starzacher, AndreasNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Steinwender, BenjaminNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Tolovski, IlinNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Tözün, PinarNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Ulatowski, WojciechNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Wang, YuanyuanYuanyuan.Wang (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Wrosz, Izajasz P.NICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Zamuda, AlesNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Zhang, CeNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Zhu, Xiaoxiangxiao.zhu (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:2022
Erschienen in:12th Annual Conference on Innovative Data Systems Research, CIDR 2022
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
Status:veröffentlicht
Stichwörter:big data
Veranstaltungstitel:CIDR 2022
Veranstaltungsort:Chaminade, US
Veranstaltungsart:internationale Konferenz
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Erdbeobachtung
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R EO - Erdbeobachtung
DLR - Teilgebiet (Projekt, Vorhaben):R - Projekt Big Data
Standort: Jena
Institute & Einrichtungen:Institut für Datenwissenschaften > Datenmanagement und -aufbereitung
Hinterlegt von: Paradies, Dr.-Ing. Marcus
Hinterlegt am:17 Nov 2022 15:37
Letzte Änderung:05 Feb 2024 13:39

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.