elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Generalizability of Code Clone Detection on CodeBERT

Sonnekalb, Tim und Gruner, Bernd und Brust, Clemens-Alexander und Mäder, Patrick (2022) Generalizability of Code Clone Detection on CodeBERT. In: 37th IEEE/ACM International Conference on Automated Software Engineering, ASE 2022. ACM. ASE 2022, 2022-10-10 - 2022-10-14, Michigan, USA. ISBN 978-145039475-8.

[img] PDF
383kB

Kurzfassung

Transformer networks such as CodeBERT already achieve very good results for code clone detection in benchmark datasets, so one could assume that this task has already been solved. However, code clone detection is not a trivial task. Semantic code clones in particular are difficult to detect. We show that the generalizability of CodeBERT decreases by evaluating two different subsets of Java code clones from BigCloneBench. We observe a significant drop of F1 score when we evaluate different code snippets and different functionality IDs than those used for model building.

elib-URL des Eintrags:https://elib.dlr.de/144942/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Generalizability of Code Clone Detection on CodeBERT
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Sonnekalb, TimTim.Sonnekalb (at) dlr.dehttps://orcid.org/0000-0002-0067-1790NICHT SPEZIFIZIERT
Gruner, BerndBernd.Gruner (at) dlr.dehttps://orcid.org/0000-0002-4177-2993152393238
Brust, Clemens-Alexanderclemens-alexander.brust (at) dlr.dehttps://orcid.org/0000-0001-5419-1998152393239
Mäder, Patrickpatrick.maeder (at) tu-ilmenau.dehttps://orcid.org/0000-0001-6871-2707NICHT SPEZIFIZIERT
Datum:10 Oktober 2022
Erschienen in:37th IEEE/ACM International Conference on Automated Software Engineering, ASE 2022
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Nein
In ISI Web of Science:Ja
Verlag:ACM
ISBN:978-145039475-8
Status:veröffentlicht
Stichwörter:clone detection, transformer networks, bigclonebench, machine learning on code
Veranstaltungstitel:ASE 2022
Veranstaltungsort:Michigan, USA
Veranstaltungsart:internationale Konferenz
Veranstaltungsbeginn:10 Oktober 2022
Veranstaltungsende:14 Oktober 2022
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Technik für Raumfahrtsysteme
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R SY - Technik für Raumfahrtsysteme
DLR - Teilgebiet (Projekt, Vorhaben):R - Intelligente Analysen und Methoden zur sicheren Softwareentwicklung, D - Kurzstudien [DAT], D - Kurzstudien [KIZ]
Standort: Jena , Köln-Porz , Oberpfaffenhofen
Institute & Einrichtungen:Institut für Datenwissenschaften
Institut für Datenwissenschaften > Datenanalyse und -intelligenz
Hinterlegt von: Sonnekalb, Tim
Hinterlegt am:05 Dez 2022 10:46
Letzte Änderung:24 Apr 2024 20:44

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.