elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Authorship analysis based on data compression

Cerra, Daniele und Reinartz, Peter und Datcu, Mihai (2014) Authorship analysis based on data compression. Pattern Recognition Letters, 42, Seiten 79-84. Elsevier. doi: 10.1016/j.patrec.2014.01.019. ISSN 0167-8655.

[img] PDF (arXiv preprint)
271kB

Offizielle URL: http://www.sciencedirect.com/science/article/pii/S0167865514000336

Kurzfassung

This paper proposes to perform authorship analysis using the Fast Compression Distance (FCD), a similarity measure based on compression with dictionaries directly extracted from the written texts. The FCD computes a similarity between two documents through an effective binary search on the intersection set between the two related dictionaries. In the reported experiments the proposed method is applied to documents which are heterogeneous in style, written in five different languages and coming from different historical periods. Results are comparable to the state of the art and outperform traditional compression-based methods.

elib-URL des Eintrags:https://elib.dlr.de/88386/
Dokumentart:Zeitschriftenbeitrag
Titel:Authorship analysis based on data compression
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Cerra, DanieleDaniele.Cerra (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Reinartz, Peterpeter.reinartz (at) dlr.dehttps://orcid.org/0000-0002-8122-1475NICHT SPEZIFIZIERT
Datcu, Mihaimihai.datcu (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:1 Juni 2014
Erschienen in:Pattern Recognition Letters
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Ja
Band:42
DOI:10.1016/j.patrec.2014.01.019
Seitenbereich:Seiten 79-84
Herausgeber:
HerausgeberInstitution und/oder E-Mail-Adresse der HerausgeberHerausgeber-ORCID-iDORCID Put Code
Borgefors, GunillaSwedish Defence Research, Linköping, SwedenNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Sanniti di Baja, Gabriellag.sannitidibaja (at) cib.na.cnr.itNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Sarkar, S.University of South Florida, Tampa, USANICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Verlag:Elsevier
Name der Reihe:International Association for Pattern Recognition
ISSN:0167-8655
Status:veröffentlicht
Stichwörter:Authorship analysis; Data compression; Similarity measure
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Erdbeobachtung
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R EO - Erdbeobachtung
DLR - Teilgebiet (Projekt, Vorhaben):R - Vorhaben hochauflösende Fernerkundungsverfahren (alt)
Standort: Oberpfaffenhofen
Institute & Einrichtungen:Institut für Methodik der Fernerkundung > Photogrammetrie und Bildanalyse
Hinterlegt von: Cerra, Daniele
Hinterlegt am:11 Mär 2014 08:54
Letzte Änderung:06 Nov 2023 14:19

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.