elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Uncertainty Quantification in CLIP using Ensemble Methods

Olbrich, Stephan (2024) Uncertainty Quantification in CLIP using Ensemble Methods. Masterarbeit, Friedrich Schiller Universität Jena.

Dieses Archiv kann nicht den Volltext zur Verfügung stellen.

Kurzfassung

The multimodal image-text model CLIP, trained with a constrastive objective, shows impressive generalization abilities in downstream tasks, such as zero-shot classification. However, the model’s performance is less promising in several complex tasks, such as traffic sign and satellite image classification. In this thesis, we study the quantification of CLIP’s data bias by examining its learned embedding space. In addition, we investigate methods to quantify the uncertainty in CLIP’s zero-shot predictions. To do this, we conduct experiments on five datasets on which CLIP has a wide range of zero-shot classification accuracies, using baseline methods and extending the use of existing data augmentation methods. Furthermore, we pursue and develop a novel approach of transferring ensemble methods to CLIP, and present three computationally efficient variants. The results show that the presented methods are capable of quantifying model uncertainty for given inputs, but also suggest that there is room for improvement. Regarding our novel approach of using ensembles, the results show that we can match, and in some cases exceed by over 6%, the accuracy of the original CLIP model. We also show that the ensembles can detect the datasets with high uncertainty, indicating CLIP’s biases.

elib-URL des Eintrags:https://elib.dlr.de/211817/
Dokumentart:Hochschulschrift (Masterarbeit)
Titel:Uncertainty Quantification in CLIP using Ensemble Methods
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Olbrich, Stephanstephan.olbrich (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:2024
Open Access:Nein
Status:veröffentlicht
Stichwörter:Contrastive Learning, Multimodal, Pre-Trained, CLIP, Zero-Shot, Data- Bias, Data Augmentation, Ensembles
Institution:Friedrich Schiller Universität Jena
Abteilung:Fakultät für Mathematik und Informatik
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Technik für Raumfahrtsysteme
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R SY - Technik für Raumfahrtsysteme
DLR - Teilgebiet (Projekt, Vorhaben):R - Maschinelles Lernen
Standort: Jena
Institute & Einrichtungen:Institut für Datenwissenschaften > Datenanalyse und -intelligenz
Hinterlegt von: Gawlikowski, Jakob
Hinterlegt am:14 Jan 2025 10:03
Letzte Änderung:14 Jan 2025 10:03

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.