elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Barrierefreiheit | Kontakt | English
Schriftgröße: [-] Text [+]

Enabling Conversational Intelligence in Service Robots Through Multimodal Fusion and Resource-Aware Generative Models

Tharmilan, T. und Henoshan, A. und Garthigan, K. und Jayasekara, A.G. Buddhika P. und LOGEESHAN, V. und Rajakaruna Wanigasekara, Chathura (2025) Enabling Conversational Intelligence in Service Robots Through Multimodal Fusion and Resource-Aware Generative Models. In: 6th IEEE Annual World AI IoT Congress, AIIoT 2025. IEEE. 2025 IEEE World AI IoT Congress (AIIoT), 2025-05-28 - 2025-05-30, Seattle, WA, USA. doi: 10.1109/AIIoT65859.2025.11105269. ISBN 979-833152508-8.

[img] PDF - Nur DLR-intern zugänglich
1MB

Offizielle URL: https://ieeexplore.ieee.org/document/11105269

Kurzfassung

The integration of generative AI, particularly large language models (LLMs) and vision-language models (VLMs), into human-robot interaction (HRI) systems is unlocking new capabilities for natural, context-aware communication. This workin-progress paper presents a modular multimodal interaction framework that enables service robots to engage in socially intelligent and emotionally responsive conversations in near realtime. Our system fuses vision and speech through a unified architecture, allowing the robot to understand user intent, emotional state, and context in a laboratory environment. By leveraging quantized generative models like LLaVA and efficient deep learning components for speech recognition and face detection, the proposed framework is designed with resource-constrained deployment in mind. While deployment is in an experimental stage, Preliminary results from module integration on development setups suggest the potential of generative multimodal AI in enabling adaptive, explainable, and collaborative human-robot interactions.

elib-URL des Eintrags:https://elib.dlr.de/215546/
Dokumentart:Konferenzbeitrag (Vorlesung)
Titel:Enabling Conversational Intelligence in Service Robots Through Multimodal Fusion and Resource-Aware Generative Models
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Tharmilan, T.University of MoratuwaNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Henoshan, A.University of MoratuwaNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Garthigan, K.University of MoratuwaNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Jayasekara, A.G. Buddhika P.University of MoratuwaNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
LOGEESHAN, V.University of MoratuwaNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Rajakaruna Wanigasekara, ChathuraChathura.Wanigasekara (at) dlr.dehttps://orcid.org/0000-0003-4371-6108192988418
Datum:September 2025
Erschienen in:6th IEEE Annual World AI IoT Congress, AIIoT 2025
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
DOI:10.1109/AIIoT65859.2025.11105269
Verlag:IEEE
ISBN:979-833152508-8
Status:veröffentlicht
Stichwörter:Human-Robot Interaction (HRI), Generative AI, Large Language Models (LLMs), Multimodal Interaction, Fusion, Service Robots, Retrieval-Augmented Generation (RAG), Context-Aware System
Veranstaltungstitel:2025 IEEE World AI IoT Congress (AIIoT)
Veranstaltungsort:Seattle, WA, USA
Veranstaltungsart:internationale Konferenz
Veranstaltungsbeginn:28 Mai 2025
Veranstaltungsende:30 Mai 2025
HGF - Forschungsbereich:keine Zuordnung
HGF - Programm:keine Zuordnung
HGF - Programmthema:keine Zuordnung
DLR - Schwerpunkt:keine Zuordnung
DLR - Forschungsgebiet:keine Zuordnung
DLR - Teilgebiet (Projekt, Vorhaben):keine Zuordnung
Standort: Geesthacht
Institute & Einrichtungen:Institut für Maritime Energiesysteme > Energiekonverter und -systeme
Hinterlegt von: Rajakaruna Wanigasekara, Chathura
Hinterlegt am:29 Sep 2025 07:47
Letzte Änderung:29 Sep 2025 07:47

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
OpenAIRE Validator logo electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.