elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Automated Processing of Pipelines Managing Now- and Forecasting of Infectious Diseases

Memon, Shahbaz und Jadebeck, Johann F. und Osthege, Michael und Wendler, Anna Clara und Kerkmann, David und Zunker, Henrik und Wiechert, Wolfgang und Nöh, Katharina und Göbbert, Jens Henrik und Hagemeier, Björn und Riedel, Morris und Kühn, Martin Joachim (2024) Automated Processing of Pipelines Managing Now- and Forecasting of Infectious Diseases. In: IEEE 47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024. IEEE Xplore. 47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024, 2024-05-20, Croatia.

[img] PDF - Postprintversion (akzeptierte Manuskriptversion)
253kB

Kurzfassung

When faced with the challenge of now- and forecasting infectious diseases, multiple data sources and state-of-the-art models have to be considered. Automatic aggregation, processing, and publishing to relevant data sinks is paramount to achieving consistent, reproducible, and timely results given daily-reported data. To facilitate scientific collaboration and reproducibility of workflows, open and extensible architectures for compute pipelines are required. In this research, we devise an architecture realizing the seamless management and processing of reproducible pipelines. Our case-study is a daily pipeline for nowcasting the state of SARS-CoV-2 in Germany based on public data and state-of-the-art models implemented in the simulation software MEmilio. The results of our pipeline are pushed to ESID (Epidemiological Scenarios for Infectious Diseases), a user interface to epidemiological simulations. To realize the given pipeline, a workflow management system is required to ensure pipeline processing and secure access to multiple heterogeneous data storages. For this purpose, we based our work on an open-source workflow management system - Apache Airflow, which provides the orchestration, coordination and management of complex connected tasks. S3 is utilized as an intermediate data storage service for sharing data between workflow steps and persisting experiment output. We provide a comprehensive view on our work on automated, end-to-end and reproducible pipelines, with detailed commentary on use case, and its realization.

elib-URL des Eintrags:https://elib.dlr.de/204216/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Automated Processing of Pipelines Managing Now- and Forecasting of Infectious Diseases
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Memon, ShahbazJülich Supercomputing Centre, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Jadebeck, Johann F.Institute for Bio- and Geosciences, IBG-1: Biotechnology, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Osthege, MichaelInstitute for Bio- and Geosciences, IBG-1: Biotechnology, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Wendler, Anna Claraanna.wendler (at) dlr.dehttps://orcid.org/0000-0002-1816-8907NICHT SPEZIFIZIERT
Kerkmann, Daviddavidchristian.kerkmann (at) helmholtz-hzi.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Zunker, Henrikhenrik.zunker (at) dlr.dehttps://orcid.org/0000-0002-9825-365XNICHT SPEZIFIZIERT
Wiechert, WolfgangInstitute for Bio- and Geosciences, IBG-1: Biotechnology, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Nöh, KatharinaInstitute for Bio- and Geosciences, IBG-1: Biotechnology, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Göbbert, Jens HenrikJülich Supercomputing Centre, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Hagemeier, BjörnJülich Supercomputing Centre, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Riedel, MorrisJülich Supercomputing Centre, Forschungszentrum Jülich GmbHNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Kühn, Martin JoachimMartin.Kuehn (at) dlr.dehttps://orcid.org/0000-0002-0906-6984NICHT SPEZIFIZIERT
Datum:2024
Erschienen in:IEEE 47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Nein
In ISI Web of Science:Nein
Verlag:IEEE Xplore
Name der Reihe:47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024
Status:akzeptierter Beitrag
Stichwörter:nowcasting, forecasting, automatization, pipeline, workflow management, end-to-end, processing
Veranstaltungstitel:47th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO 2024
Veranstaltungsort:Croatia
Veranstaltungsart:internationale Konferenz
Veranstaltungsdatum:20 Mai 2024
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Technik für Raumfahrtsysteme
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R SY - Technik für Raumfahrtsysteme
DLR - Teilgebiet (Projekt, Vorhaben):R - Aufgaben SISTEC
Standort: Köln-Porz
Institute & Einrichtungen:Institut für Softwaretechnologie
Institut für Softwaretechnologie > High-Performance Computing
Hinterlegt von: Kühn, Dr. Martin Joachim
Hinterlegt am:22 Mai 2024 09:27
Letzte Änderung:22 Mai 2024 09:27

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.