elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

A Comparative Heuristic Evaluation of Kadi4Mat Through Human Evaluators and GPT-4

Meinecke, Annika und Heidrich, David und Dworatzyk, Katharina und Theis, Sabine (2024) A Comparative Heuristic Evaluation of Kadi4Mat Through Human Evaluators and GPT-4. In: 26th International Conference on Human-Computer Interaction, HCII 2024, 15380, Seiten 91-108. Springer, Cham. International Conference on Human-Computer Interaction, 2024-06-29 - 2024-07-04, Washington DC, USA. doi: 10.1007/978-3-031-76821-7_8. ISBN 978-3-031-76821-7. ISSN 0302-9743.

[img] PDF - Nur DLR-intern zugänglich
381kB

Offizielle URL: https://link.springer.com/chapter/10.1007/978-3-031-76821-7_8

Kurzfassung

While usability aspects play a crucial role in socio-technical systems, proper usability evaluations are often neglected during development due to time and financial constraints or the lack of availability of usability experts. To assess the suitability of generative AI as a usability evaluator, we conducted a heuristic evaluation comparing GPT-4 to a group of seven human evaluators with backgrounds in human-computer interaction, computer science or behavioral science. As performance measures we used the number of identified usability issues and severity ratings as well as the nature and quality of the problem description. No significant differences were found regarding identification rates of usability issues or severity ratings except for the overall identification rate. Thematic analysis, however, showed that the problem descriptions differed qualitatively in specificity, coverage, clarity and insightfulness. GPT-4 generated more detailed, very clear and insightful problem descriptions of a broader coverage than human evaluators. Our results provide initial evidence for the suitability of GPT-4 as a usability expert. However, the results should be viewed with caution as sample size was small and included only one expert. Future studies are needed, including more experienced usability experts and more GPT-4 cases to properly test for quantitative differences.

elib-URL des Eintrags:https://elib.dlr.de/211010/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:A Comparative Heuristic Evaluation of Kadi4Mat Through Human Evaluators and GPT-4
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Meinecke, AnnikaAnnika.Meinecke (at) dlr.dehttps://orcid.org/0000-0001-9766-8995NICHT SPEZIFIZIERT
Heidrich, DavidDavid.Heidrich (at) dlr.dehttps://orcid.org/0000-0002-8501-5089NICHT SPEZIFIZIERT
Dworatzyk, KatharinaKatharina.Dworatzyk (at) dlr.dehttps://orcid.org/0000-0002-4927-1464173944326
Theis, Sabinesabine.theis (at) dlr.dehttps://orcid.org/0000-0002-3422-3734173944327
Datum:17 Dezember 2024
Erschienen in:26th International Conference on Human-Computer Interaction, HCII 2024
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
Band:15380
DOI:10.1007/978-3-031-76821-7_8
Seitenbereich:Seiten 91-108
Verlag:Springer, Cham
Name der Reihe:Lecture Notes in Computer Science
ISSN:0302-9743
ISBN:978-3-031-76821-7
Status:veröffentlicht
Stichwörter:Heuristic Evaluation, Generative AI, Usability
Veranstaltungstitel:International Conference on Human-Computer Interaction
Veranstaltungsort:Washington DC, USA
Veranstaltungsart:internationale Konferenz
Veranstaltungsbeginn:29 Juni 2024
Veranstaltungsende:4 Juli 2024
HGF - Forschungsbereich:keine Zuordnung
HGF - Programm:keine Zuordnung
HGF - Programmthema:keine Zuordnung
DLR - Schwerpunkt:Digitalisierung
DLR - Forschungsgebiet:D DAT - Daten
DLR - Teilgebiet (Projekt, Vorhaben):D - eLAB.DLR
Standort: Köln-Porz , Oberpfaffenhofen
Institute & Einrichtungen:Institut für Softwaretechnologie > Intelligente und verteilte Systeme
Institut für Softwaretechnologie
Hinterlegt von: Meinecke, Annika
Hinterlegt am:17 Dez 2024 14:42
Letzte Änderung:17 Dez 2024 14:42

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.