elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Automated Processing of Pipelines Managing Now- and Forecasting of Infectious Diseases

Memon, Shahbaz und Jadebeck, Johann F. und Osthege, Michael und Wendler, Anna Clara und Kerkmann, David und Zunker, Henrik und Wiechert, Wolfgang und Nöh, Katharina und Göbbert, Jens Henrik und Hagemeier, Björn und Riedel, Morris und Kühn, Martin Joachim (2024) Automated Processing of Pipelines Managing Now- and Forecasting of Infectious Diseases. In: 2024 47th ICT and Electronics Convention, MIPRO 2024 - Proceedings. IEEE. 47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024, 2024-05-20, Croatia. doi: 10.1109/MIPRO60963.2024.10569336. ISBN 979-835038249-5. ISSN 2623-8764.

[img] PDF
248kB

Offizielle URL: https://ieeexplore.ieee.org/document/10569336

Kurzfassung

When faced with the challenge of now- and forecasting infectious diseases, multiple data sources and state-of-the-art models have to be considered. Automatic aggregation, processing, and publishing to relevant data sinks is paramount to achieving consistent, reproducible, and timely results given daily-reported data. To facilitate scientific collaboration and reproducibility of workflows, open and extensible architectures for compute pipelines are required. In this research, we devise an architecture realizing the seamless management and processing of reproducible pipelines. Our case-study is a daily pipeline for nowcasting the state of SARS-CoV-2 in Germany based on public data and state-of-the-art models implemented in the simulation software MEmilio. The results of our pipeline are pushed to ESID (Epidemiological Scenarios for Infectious Diseases), a user interface to epidemiological simulations. To realize the given pipeline, a workflow management system is required to ensure pipeline processing and secure access to multiple heterogeneous data storages. For this purpose, we based our work on an open-source workflow management system - Apache Airflow, which provides the orchestration, coordination and management of complex connected tasks. S3 is utilized as an intermediate data storage service for sharing data between workflow steps and persisting experiment output. We provide a comprehensive view on our work on automated, end-to-end and reproducible pipelines, with detailed commentary on use case, and its realization.

elib-URL des Eintrags:https://elib.dlr.de/205435/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Automated Processing of Pipelines Managing Now- and Forecasting of Infectious Diseases
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Memon, ShahbazJülich Supercomputing Centre, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Jadebeck, Johann F.Institute for Bio- and Geosciences, IBG-1: Biotechnology, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Osthege, MichaelInstitute for Bio- and Geosciences, IBG-1: Biotechnology, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Wendler, Anna Claraanna.wendler (at) dlr.dehttps://orcid.org/0000-0002-1816-8907NICHT SPEZIFIZIERT
Kerkmann, Daviddavidchristian.kerkmann (at) helmholtz-hzi.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Zunker, Henrikhenrik.zunker (at) dlr.dehttps://orcid.org/0000-0002-9825-365X164795614
Wiechert, WolfgangInstitute for Bio- and Geosciences, IBG-1: Biotechnology, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Nöh, KatharinaInstitute for Bio- and Geosciences, IBG-1: Biotechnology, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Göbbert, Jens HenrikJülich Supercomputing Centre, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Hagemeier, BjörnJülich Supercomputing Centre, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Riedel, MorrisJülich Supercomputing Centre, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Kühn, Martin JoachimMartin.Kuehn (at) dlr.dehttps://orcid.org/0000-0002-0906-6984NICHT SPEZIFIZIERT
Datum:2024
Erschienen in:2024 47th ICT and Electronics Convention, MIPRO 2024 - Proceedings
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
DOI:10.1109/MIPRO60963.2024.10569336
Verlag:IEEE
Name der Reihe:47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024
ISSN:2623-8764
ISBN:979-835038249-5
Status:veröffentlicht
Stichwörter:nowcasting, forecasting, automatization, pipeline, workflow management, end-to-end, processing
Veranstaltungstitel:47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024
Veranstaltungsort:Croatia
Veranstaltungsart:internationale Konferenz
Veranstaltungsdatum:20 Mai 2024
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Technik für Raumfahrtsysteme
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R SY - Technik für Raumfahrtsysteme
DLR - Teilgebiet (Projekt, Vorhaben):R - Aufgaben SISTEC
Standort: Köln-Porz
Institute & Einrichtungen:Institut für Softwaretechnologie
Institut für Softwaretechnologie > High-Performance Computing
Hinterlegt von: Kühn, Dr. Martin Joachim
Hinterlegt am:02 Aug 2024 10:50
Letzte Änderung:02 Aug 2024 10:50

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.