elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Barrierefreiheit | Kontakt | English
Schriftgröße: [-] Text [+]

Are Vision-Language Foundation Models Able to Fly?

Rüter, Joachim und Davydov, Philipp und Maienschein, Theresa Diana und Durak, Umut und Dauer, Johann C. (2025) Are Vision-Language Foundation Models Able to Fly? In: 44th AIAA DATC/IEEE Digital Avionics Systems Conference, DASC 2025. Institute of Electrical and Electronics Engineers Inc.. Digital Avionics Systems Conference, 2025-09-14, Montreal, Kanada. doi: 10.1109/DASC66011.2025.11257290. ISBN 979-833152519-4. ISSN 2155-7195.

[img] PDF - Nur DLR-intern zugänglich
5MB

Kurzfassung

Safe autonomous aircraft require accurate environment perception, which can be achieved through semantic segmentation of camera images. However, training neural networks relies on large, diverse datasets that are often unavailable in aviation. Vision-language foundation models offer a promising alternative, but their accuracy for aviation tasks is an open question as the aerial perspective might not be adequately represented in the original training data. Against this background, this paper investigates the performance of two vision-language foundation models, CLIPSeg and CAT-Seg, on an aerial image dataset. Our experiments show that the models can achieve competitive semantic segmentation performance without aviation-specific training. This paper further examines prompt engineering and discusses challenges of deploying these models in aviation. While certification and runtime constraints pose significant hurdles, our findings suggest that vision-language foundation models have potential for improving environment perception in aviation and may reduce the need for extensive training data in the future.

elib-URL des Eintrags:https://elib.dlr.de/221917/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Are Vision-Language Foundation Models Able to Fly?
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Rüter, Joachimjoachim.rueter (at) dlr.dehttps://orcid.org/0000-0002-5559-5481203720200
Davydov, PhilippNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Maienschein, Theresa DianaTheresa.Maienschein (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Durak, UmutUmut.Durak (at) dlr.dehttps://orcid.org/0000-0002-2928-1710203720201
Dauer, Johann C.Johann.Dauer (at) dlr.dehttps://orcid.org/0000-0002-8287-2376NICHT SPEZIFIZIERT
Datum:2025
Erschienen in:44th AIAA DATC/IEEE Digital Avionics Systems Conference, DASC 2025
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Ja
DOI:10.1109/DASC66011.2025.11257290
Verlag:Institute of Electrical and Electronics Engineers Inc.
Name der Reihe:AIAA/IEEE Digital Avionics Systems Conference - Proceedings
ISSN:2155-7195
ISBN:979-833152519-4
Status:veröffentlicht
Stichwörter:Semantic Segmentation, Vision-Language Models, Deep Learning, Unmanned Aircraft System, Autonomy
Veranstaltungstitel:Digital Avionics Systems Conference
Veranstaltungsort:Montreal, Kanada
Veranstaltungsart:internationale Konferenz
Veranstaltungsdatum:14 September 2025
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Luftfahrt
HGF - Programmthema:Komponenten und Systeme
DLR - Schwerpunkt:Luftfahrt
DLR - Forschungsgebiet:L CS - Komponenten und Systeme
DLR - Teilgebiet (Projekt, Vorhaben):L - Unbemannte Flugsysteme
Standort: Braunschweig
Institute & Einrichtungen:Institut für Flugsystemtechnik > Unbemannte Luftfahrzeuge
Institut für Flugsystemtechnik > Sichere Systeme und System Engineering
Institut für Flugsystemtechnik
Hinterlegt von: Rüter, Joachim
Hinterlegt am:27 Jan 2026 12:26
Letzte Änderung:24 Feb 2026 09:49

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
OpenAIRE Validator logo electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.