elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Style Vectors for Steering Generative Large Language Models

Konen, Kai und Jentzsch, Sophie Freya und Diallo, Diaoulé und Schütt, Peer und Bensch, Oliver und El Baff, Roxanne und Opitz, Dominik und Hecking, Tobias (2024) Style Vectors for Steering Generative Large Language Models. In: 18th Conference of the European Chapter of the Association for Computational Linguistics, EACL 2024 - Findings of EACL 2024. European Chapter of the ACL (EACL), 2024-03-17 - 2024-03-22, St Julians, Malta. ISBN 9798891760936.

[img] PDF
1MB

Kurzfassung

This research explores strategies for steering the output of large language models (LLMs) towards specific styles, such as sentiment, emotion, or writing style, by adding style vectors to the activations of hidden layers during text generation. We show that style vectors can be simply computed from recorded layer activations for input texts in a specific style in contrast to more complex training-based approaches. Through a series of experiments, we demonstrate the effectiveness of activation engineering using such style vectors to influence the style of generated text in a nuanced and parameterisable way, distinguishing it from prompt engineering. The presented research constitutes a significant step towards developing more adaptive and effective AI-empowered interactive systems.

elib-URL des Eintrags:https://elib.dlr.de/202646/
Dokumentart:Konferenzbeitrag (Poster)
Titel:Style Vectors for Steering Generative Large Language Models
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Konen, KaiKai.Konen (at) dlr.dehttps://orcid.org/0000-0001-7957-4477NICHT SPEZIFIZIERT
Jentzsch, Sophie FreyaSophie.Jentzsch (at) dlr.dehttps://orcid.org/0000-0001-6217-8814NICHT SPEZIFIZIERT
Diallo, Diaoulédiaoule.diallo (at) dlr.dehttps://orcid.org/0000-0001-9226-0050NICHT SPEZIFIZIERT
Schütt, Peerpeer.schuett (at) dlr.dehttps://orcid.org/0000-0002-6513-5235NICHT SPEZIFIZIERT
Bensch, Oliveroliver.bensch (at) dlr.dehttps://orcid.org/0000-0001-7026-5619NICHT SPEZIFIZIERT
El Baff, RoxanneRoxanne.ElBaff (at) dlr.dehttps://orcid.org/0000-0001-6661-8661NICHT SPEZIFIZIERT
Opitz, Dominikdominik.opitz (at) dlr.dehttps://orcid.org/0009-0009-1234-6379NICHT SPEZIFIZIERT
Hecking, TobiasTobias.Hecking (at) dlr.dehttps://orcid.org/0000-0003-0833-7989NICHT SPEZIFIZIERT
Datum:2024
Erschienen in:18th Conference of the European Chapter of the Association for Computational Linguistics, EACL 2024 - Findings of EACL 2024
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
ISBN:9798891760936
Status:akzeptierter Beitrag
Stichwörter:Large Language Models, Generative AI, Neural Networks
Veranstaltungstitel:European Chapter of the ACL (EACL)
Veranstaltungsort:St Julians, Malta
Veranstaltungsart:internationale Konferenz
Veranstaltungsbeginn:17 März 2024
Veranstaltungsende:22 März 2024
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Technik für Raumfahrtsysteme
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R SY - Technik für Raumfahrtsysteme
DLR - Teilgebiet (Projekt, Vorhaben):R - Aufgaben SISTEC, R - Kollaboration von Luftfahrt-Operateuren und KI-Systemen
Standort: Rhein-Sieg-Kreis
Institute & Einrichtungen:Institut für Softwaretechnologie
Institut für Softwaretechnologie > Intelligente und verteilte Systeme
Hinterlegt von: Jentzsch, Sophie Freya
Hinterlegt am:21 Feb 2024 10:03
Letzte Änderung:13 Nov 2024 15:15

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.