elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Barrierefreiheit | Kontakt | English
Schriftgröße: [-] Text [+]

Are Vision-Language Foundation Models Able to Fly?

Rüter, Joachim und Davydov, Philipp und Maienschein, Theresa Diana und Durak, Umut und Dauer, Johann C. (2025) Are Vision-Language Foundation Models Able to Fly? In: 44rd AIAA DATC/IEEE Digital Avionics Systems Conference, DASC 2025. Digital Avionics Systems Conference, 2025-09-14, Montreal, Kanada.

[img] PDF - Nur DLR-intern zugänglich
5MB

Kurzfassung

Safe autonomous aircraft require accurate environment perception, which can be achieved through semantic segmentation of camera images. However, training neural networks relies on large, diverse datasets that are often unavailable in aviation. Vision-language foundation models offer a promising alternative, but their accuracy for aviation tasks is an open question as the aerial perspective might not be adequately represented in the original training data. Against this background, this paper investigates the performance of two vision-language foundation models, CLIPSeg and CAT-Seg, on an aerial image dataset. Our experiments show that the models can achieve competitive semantic segmentation performance without aviation-specific training. This paper further examines prompt engineering and discusses challenges of deploying these models in aviation. While certification and runtime constraints pose significant hurdles, our findings suggest that vision-language foundation models have potential for improving environment perception in aviation and may reduce the need for extensive training data in the future.

elib-URL des Eintrags:https://elib.dlr.de/221917/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Are Vision-Language Foundation Models Able to Fly?
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Rüter, Joachimjoachim.rueter (at) dlr.dehttps://orcid.org/0000-0002-5559-5481203720200
Davydov, PhilippNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Maienschein, Theresa DianaTheresa.Maienschein (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Durak, UmutUmut.Durak (at) dlr.dehttps://orcid.org/0000-0002-2928-1710203720201
Dauer, Johann C.Johann.Dauer (at) dlr.dehttps://orcid.org/0000-0002-8287-2376NICHT SPEZIFIZIERT
Datum:2025
Erschienen in:44rd AIAA DATC/IEEE Digital Avionics Systems Conference, DASC 2025
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Nein
In ISI Web of Science:Nein
Status:veröffentlicht
Stichwörter:Semantic Segmentation, Vision-Language Models, Deep Learning, Unmanned Aircraft System, Autonomy
Veranstaltungstitel:Digital Avionics Systems Conference
Veranstaltungsort:Montreal, Kanada
Veranstaltungsart:internationale Konferenz
Veranstaltungsdatum:14 September 2025
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Luftfahrt
HGF - Programmthema:Komponenten und Systeme
DLR - Schwerpunkt:Luftfahrt
DLR - Forschungsgebiet:L CS - Komponenten und Systeme
DLR - Teilgebiet (Projekt, Vorhaben):L - Unbemannte Flugsysteme
Standort: Braunschweig
Institute & Einrichtungen:Institut für Flugsystemtechnik > Unbemannte Luftfahrzeuge
Institut für Flugsystemtechnik > Sichere Systeme und System Engineering
Institut für Flugsystemtechnik
Hinterlegt von: Rüter, Joachim
Hinterlegt am:27 Jan 2026 12:26
Letzte Änderung:27 Jan 2026 12:26

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
OpenAIRE Validator logo electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.