elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Barrierefreiheit | Kontakt | English
Schriftgröße: [-] Text [+]

Designing a Framework for DataOps: Improving Data Quality and Pipeline Efficiency in Data Science

Haertel, Christian und Sagavakar, Kunal Sanjay und Staegemann, Daniel und Pohl, Matthias und Volk, Matthias und Turowski, Klaus (2026) Designing a Framework for DataOps: Improving Data Quality and Pipeline Efficiency in Data Science. Procedia Computer Science. Elsevier. ISSN 1877-0509. (im Druck)

Dieses Archiv kann nicht den Volltext zur Verfügung stellen.

Kurzfassung

Data Science (DS), with the application of methods from Data Analytics, can assist organizations in deriving value from huge amounts of data to improve performance. To be able to provide actionable insights from this resource, a significant effort in DS is attributed to the data collection, cleaning, and transformation to construct a target high-quality dataset for analytics. However, the traditional, predominantly manual approach to data preparation is considered inefficient and error-prone, failing to meet the requirements of Big Data environments and the adaptability to react to changing conditions. DataOps aims to combine best practices and technologies from DevOps to automate stages of the data lifecycle to increase the quality and reliability of data pipelines. Hence, in this paper, a framework is proposed to guide DataOps implementation, using the Design Science Research methodology. The applicability of the artifact is demonstrated in a case study in urban mobility analytics.

elib-URL des Eintrags:https://elib.dlr.de/221861/
Dokumentart:Zeitschriftenbeitrag
Titel:Designing a Framework for DataOps: Improving Data Quality and Pipeline Efficiency in Data Science
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Haertel, Christianchristian.haertel (at) ovgu.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Sagavakar, Kunal SanjayNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Staegemann, Danieldaniel.staegemann (at) ovgu.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Pohl, Matthiasmatthias.pohl (at) dlr.dehttps://orcid.org/0000-0002-6241-7675NICHT SPEZIFIZIERT
Volk, Matthiasmatthias.volk (at) ovgu.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Turowski, Klausklaus.turowski (at) ovgu.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:2026
Erschienen in:Procedia Computer Science
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
Verlag:Elsevier
ISSN:1877-0509
Status:im Druck
Stichwörter:Data Science; Data Analytics; DataOps; Design Science Research; Cloud Computing.
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:keine Zuordnung
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R - keine Zuordnung
DLR - Teilgebiet (Projekt, Vorhaben):R - keine Zuordnung
Standort: Jena
Institute & Einrichtungen:Institut für Datenwissenschaften > Datenmanagement und -aufbereitung
Hinterlegt von: Pohl, Matthias
Hinterlegt am:09 Jan 2026 08:13
Letzte Änderung:09 Jan 2026 08:13

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
OpenAIRE Validator logo electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.