Sonnekalb, Tim und Gruner, Bernd und Brust, Clemens-Alexander und Mäder, Patrick (2022) Generalizability of Code Clone Detection on CodeBERT. In: 37th IEEE/ACM International Conference on Automated Software Engineering, ASE 2022. ACM. ASE 2022, 2022-10-10 - 2022-10-14, Michigan, USA. ISBN 978-145039475-8.
PDF
383kB |
Kurzfassung
Transformer networks such as CodeBERT already achieve very good results for code clone detection in benchmark datasets, so one could assume that this task has already been solved. However, code clone detection is not a trivial task. Semantic code clones in particular are difficult to detect. We show that the generalizability of CodeBERT decreases by evaluating two different subsets of Java code clones from BigCloneBench. We observe a significant drop of F1 score when we evaluate different code snippets and different functionality IDs than those used for model building.
elib-URL des Eintrags: | https://elib.dlr.de/144942/ | ||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Konferenzbeitrag (Vortrag) | ||||||||||||||||||||
Titel: | Generalizability of Code Clone Detection on CodeBERT | ||||||||||||||||||||
Autoren: |
| ||||||||||||||||||||
Datum: | 10 Oktober 2022 | ||||||||||||||||||||
Erschienen in: | 37th IEEE/ACM International Conference on Automated Software Engineering, ASE 2022 | ||||||||||||||||||||
Referierte Publikation: | Ja | ||||||||||||||||||||
Open Access: | Ja | ||||||||||||||||||||
Gold Open Access: | Nein | ||||||||||||||||||||
In SCOPUS: | Nein | ||||||||||||||||||||
In ISI Web of Science: | Ja | ||||||||||||||||||||
Verlag: | ACM | ||||||||||||||||||||
ISBN: | 978-145039475-8 | ||||||||||||||||||||
Status: | veröffentlicht | ||||||||||||||||||||
Stichwörter: | clone detection, transformer networks, bigclonebench, machine learning on code | ||||||||||||||||||||
Veranstaltungstitel: | ASE 2022 | ||||||||||||||||||||
Veranstaltungsort: | Michigan, USA | ||||||||||||||||||||
Veranstaltungsart: | internationale Konferenz | ||||||||||||||||||||
Veranstaltungsbeginn: | 10 Oktober 2022 | ||||||||||||||||||||
Veranstaltungsende: | 14 Oktober 2022 | ||||||||||||||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||||||||||||||
HGF - Programm: | Raumfahrt | ||||||||||||||||||||
HGF - Programmthema: | Technik für Raumfahrtsysteme | ||||||||||||||||||||
DLR - Schwerpunkt: | Raumfahrt | ||||||||||||||||||||
DLR - Forschungsgebiet: | R SY - Technik für Raumfahrtsysteme | ||||||||||||||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | R - Intelligente Analysen und Methoden zur sicheren Softwareentwicklung, D - Kurzstudien [DAT], D - Kurzstudien [KIZ] | ||||||||||||||||||||
Standort: | Jena , Köln-Porz , Oberpfaffenhofen | ||||||||||||||||||||
Institute & Einrichtungen: | Institut für Datenwissenschaften Institut für Datenwissenschaften > Datenanalyse und -intelligenz | ||||||||||||||||||||
Hinterlegt von: | Sonnekalb, Tim | ||||||||||||||||||||
Hinterlegt am: | 05 Dez 2022 10:46 | ||||||||||||||||||||
Letzte Änderung: | 24 Apr 2024 20:44 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags