Memon, Shahbaz und Jadebeck, Johann F. und Osthege, Michael und Wendler, Anna Clara und Kerkmann, David und Zunker, Henrik und Wiechert, Wolfgang und Nöh, Katharina und Göbbert, Jens Henrik und Hagemeier, Björn und Riedel, Morris und Kühn, Martin Joachim (2024) Automated Processing of Pipelines Managing Now- and Forecasting of Infectious Diseases. In: 2024 47th ICT and Electronics Convention, MIPRO 2024 - Proceedings. IEEE. 47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024, 2024-05-20, Croatia. doi: 10.1109/MIPRO60963.2024.10569336. ISBN 979-835038249-5. ISSN 2623-8764.
PDF
248kB |
Offizielle URL: https://ieeexplore.ieee.org/document/10569336
Kurzfassung
When faced with the challenge of now- and forecasting infectious diseases, multiple data sources and state-of-the-art models have to be considered. Automatic aggregation, processing, and publishing to relevant data sinks is paramount to achieving consistent, reproducible, and timely results given daily-reported data. To facilitate scientific collaboration and reproducibility of workflows, open and extensible architectures for compute pipelines are required. In this research, we devise an architecture realizing the seamless management and processing of reproducible pipelines. Our case-study is a daily pipeline for nowcasting the state of SARS-CoV-2 in Germany based on public data and state-of-the-art models implemented in the simulation software MEmilio. The results of our pipeline are pushed to ESID (Epidemiological Scenarios for Infectious Diseases), a user interface to epidemiological simulations. To realize the given pipeline, a workflow management system is required to ensure pipeline processing and secure access to multiple heterogeneous data storages. For this purpose, we based our work on an open-source workflow management system - Apache Airflow, which provides the orchestration, coordination and management of complex connected tasks. S3 is utilized as an intermediate data storage service for sharing data between workflow steps and persisting experiment output. We provide a comprehensive view on our work on automated, end-to-end and reproducible pipelines, with detailed commentary on use case, and its realization.
elib-URL des Eintrags: | https://elib.dlr.de/205435/ | ||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Konferenzbeitrag (Vortrag) | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Titel: | Automated Processing of Pipelines Managing Now- and Forecasting of Infectious Diseases | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Autoren: |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||
Datum: | 2024 | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Erschienen in: | 2024 47th ICT and Electronics Convention, MIPRO 2024 - Proceedings | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Referierte Publikation: | Ja | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Open Access: | Ja | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Gold Open Access: | Nein | ||||||||||||||||||||||||||||||||||||||||||||||||||||
In SCOPUS: | Ja | ||||||||||||||||||||||||||||||||||||||||||||||||||||
In ISI Web of Science: | Nein | ||||||||||||||||||||||||||||||||||||||||||||||||||||
DOI: | 10.1109/MIPRO60963.2024.10569336 | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Verlag: | IEEE | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Name der Reihe: | 47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024 | ||||||||||||||||||||||||||||||||||||||||||||||||||||
ISSN: | 2623-8764 | ||||||||||||||||||||||||||||||||||||||||||||||||||||
ISBN: | 979-835038249-5 | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Status: | veröffentlicht | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Stichwörter: | nowcasting, forecasting, automatization, pipeline, workflow management, end-to-end, processing | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Veranstaltungstitel: | 47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024 | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Veranstaltungsort: | Croatia | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Veranstaltungsart: | internationale Konferenz | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Veranstaltungsdatum: | 20 Mai 2024 | ||||||||||||||||||||||||||||||||||||||||||||||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||||||||||||||||||||||||||||||||||||||||||||||
HGF - Programm: | Raumfahrt | ||||||||||||||||||||||||||||||||||||||||||||||||||||
HGF - Programmthema: | Technik für Raumfahrtsysteme | ||||||||||||||||||||||||||||||||||||||||||||||||||||
DLR - Schwerpunkt: | Raumfahrt | ||||||||||||||||||||||||||||||||||||||||||||||||||||
DLR - Forschungsgebiet: | R SY - Technik für Raumfahrtsysteme | ||||||||||||||||||||||||||||||||||||||||||||||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | R - Aufgaben SISTEC | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Standort: | Köln-Porz | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Institute & Einrichtungen: | Institut für Softwaretechnologie Institut für Softwaretechnologie > High-Performance Computing | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Hinterlegt von: | Kühn, Dr. Martin Joachim | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Hinterlegt am: | 02 Aug 2024 10:50 | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Letzte Änderung: | 02 Aug 2024 10:50 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags