elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Optimal Model Placement in Heterogeneous Edge AI Environments

Al-Bataineh, Bara und Paradies, Marcus und Dembska, Marta und Pohl, Matthias (2025) Optimal Model Placement in Heterogeneous Edge AI Environments. Procedia Computer Science. Elsevier. doi: 10.1016/j.procs.2025.01.252. ISSN 1877-0509. (im Druck)

[img] PDF - Nur DLR-intern zugänglich - Postprintversion (akzeptierte Manuskriptversion)
287kB

Kurzfassung

With the rise of high-resolution sensors in Earth observation satellites, wildlife cameras, and autonomous vehicles, the volume of edge-generated data has significantly increased. Analyzing this data using Deep Learning (DL) models often requires moving it to remote computing facilities, leading to longer execution times and higher energy consumption. To minimize unnecessary data transfer, Edge AI accelerators like the Edge TPU (ETPU) offer fast, low-power inference close to data sources. However, due to limited on-chip memory and support for various neural network operations, these accelerators are often used with power-efficient CPUs in single-user, single-model scenarios. In this work, we tackle the automatic mapping of multiple DL models to heterogeneous resources (CPUs and ETPUs) for efficient inference in multi-user, multi-model environments. We present Maggie, which optimally allocates DL models to minimize latency and maximize ETPU memory utilization. Our results indicate that Maggie achieves up to 7 times lower latency compared to a CPU-only baseline and about 3 times lower latency than an ETPU-only baseline across various neural network architectures.

elib-URL des Eintrags:https://elib.dlr.de/211457/
Dokumentart:Zeitschriftenbeitrag
Titel:Optimal Model Placement in Heterogeneous Edge AI Environments
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Al-Bataineh, BaraBara.Al-Bataineh (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Paradies, MarcusMarcus.Paradies (at) tu-ilmenau.dehttps://orcid.org/0000-0002-5743-6580NICHT SPEZIFIZIERT
Dembska, MartaMarta.Dembska (at) dlr.dehttps://orcid.org/0000-0002-8180-1525NICHT SPEZIFIZIERT
Pohl, Matthiasmatthias.pohl (at) dlr.dehttps://orcid.org/0000-0002-6241-7675NICHT SPEZIFIZIERT
Datum:2025
Erschienen in:Procedia Computer Science
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
DOI:10.1016/j.procs.2025.01.252
Verlag:Elsevier
ISSN:1877-0509
Status:im Druck
Stichwörter:Edge TPU, Model Placement, Neural Network, Edge AI, Optimization
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:keine Zuordnung
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R - keine Zuordnung
DLR - Teilgebiet (Projekt, Vorhaben):R - keine Zuordnung
Standort: Jena
Institute & Einrichtungen:Institut für Datenwissenschaften
Institut für Datenwissenschaften > Datenmanagement und -aufbereitung
Hinterlegt von: Pohl, Matthias
Hinterlegt am:06 Jan 2025 10:41
Letzte Änderung:26 Feb 2025 14:04

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.