Konen, Kai und Jentzsch, Sophie Freya und Diallo, Diaoulé und Schütt, Peer und Bensch, Oliver und El Baff, Roxanne und Opitz, Dominik und Hecking, Tobias (2024) Style Vectors for Steering Generative Large Language Models. In: 18th Conference of the European Chapter of the Association for Computational Linguistics, EACL 2024 - Findings of EACL 2024. European Chapter of the ACL (EACL), 2024-03-17 - 2024-03-22, St Julians, Malta. ISBN 9798891760936.
PDF
1MB |
Kurzfassung
This research explores strategies for steering the output of large language models (LLMs) towards specific styles, such as sentiment, emotion, or writing style, by adding style vectors to the activations of hidden layers during text generation. We show that style vectors can be simply computed from recorded layer activations for input texts in a specific style in contrast to more complex training-based approaches. Through a series of experiments, we demonstrate the effectiveness of activation engineering using such style vectors to influence the style of generated text in a nuanced and parameterisable way, distinguishing it from prompt engineering. The presented research constitutes a significant step towards developing more adaptive and effective AI-empowered interactive systems.
elib-URL des Eintrags: | https://elib.dlr.de/202646/ | ||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Konferenzbeitrag (Poster) | ||||||||||||||||||||||||||||||||||||
Titel: | Style Vectors for Steering Generative Large Language Models | ||||||||||||||||||||||||||||||||||||
Autoren: |
| ||||||||||||||||||||||||||||||||||||
Datum: | 2024 | ||||||||||||||||||||||||||||||||||||
Erschienen in: | 18th Conference of the European Chapter of the Association for Computational Linguistics, EACL 2024 - Findings of EACL 2024 | ||||||||||||||||||||||||||||||||||||
Referierte Publikation: | Ja | ||||||||||||||||||||||||||||||||||||
Open Access: | Ja | ||||||||||||||||||||||||||||||||||||
Gold Open Access: | Nein | ||||||||||||||||||||||||||||||||||||
In SCOPUS: | Ja | ||||||||||||||||||||||||||||||||||||
In ISI Web of Science: | Nein | ||||||||||||||||||||||||||||||||||||
ISBN: | 9798891760936 | ||||||||||||||||||||||||||||||||||||
Status: | veröffentlicht | ||||||||||||||||||||||||||||||||||||
Stichwörter: | Large Language Models, Generative AI, Neural Networks | ||||||||||||||||||||||||||||||||||||
Veranstaltungstitel: | European Chapter of the ACL (EACL) | ||||||||||||||||||||||||||||||||||||
Veranstaltungsort: | St Julians, Malta | ||||||||||||||||||||||||||||||||||||
Veranstaltungsart: | internationale Konferenz | ||||||||||||||||||||||||||||||||||||
Veranstaltungsbeginn: | 17 März 2024 | ||||||||||||||||||||||||||||||||||||
Veranstaltungsende: | 22 März 2024 | ||||||||||||||||||||||||||||||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||||||||||||||||||||||||||||||
HGF - Programm: | Raumfahrt | ||||||||||||||||||||||||||||||||||||
HGF - Programmthema: | Technik für Raumfahrtsysteme | ||||||||||||||||||||||||||||||||||||
DLR - Schwerpunkt: | Raumfahrt | ||||||||||||||||||||||||||||||||||||
DLR - Forschungsgebiet: | R SY - Technik für Raumfahrtsysteme | ||||||||||||||||||||||||||||||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | R - Aufgaben SISTEC, R - Kollaboration von Luftfahrt-Operateuren und KI-Systemen | ||||||||||||||||||||||||||||||||||||
Standort: | Rhein-Sieg-Kreis | ||||||||||||||||||||||||||||||||||||
Institute & Einrichtungen: | Institut für Softwaretechnologie Institut für Softwaretechnologie > Intelligente und verteilte Systeme | ||||||||||||||||||||||||||||||||||||
Hinterlegt von: | Jentzsch, Sophie Freya | ||||||||||||||||||||||||||||||||||||
Hinterlegt am: | 21 Feb 2024 10:03 | ||||||||||||||||||||||||||||||||||||
Letzte Änderung: | 17 Dez 2024 11:33 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags