elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

One Class Text Classification using an Ensemble of Classifiers

Mayaluru, Hemanth Kumar Reddy (2020) One Class Text Classification using an Ensemble of Classifiers. Masterarbeit, Rheinische Friedrich-Wilhelms-Universität Bonn.

[img] PDF
1MB

Kurzfassung

Traditional classification algorithms work in a closed-world scenario where the training data contains all existing classes. In contrast, open set classifiers can handle new input that does not belong to any of the classes seen during training. Open set classification has been studied intensively in the computer vision domain, primarily in handwriting recognition, face recognition, object classification and computer forensics. Here we are interested in open set classification in natural language processing in one class document classification. We propose a new system based on autoencoder for one class classification of documents leveraging the full text. Extending further, we propose a novel ensemble based classifier model, a combination of several basic classifiers, to detect if an incoming document belongs to the class known from training or an unknown class. We compare and evaluate our methods on existing one class classification datasets for NLP - 20 Newsgroups, reuters and webkb. We also extract and use a new full-text dataset from arxiv.org. Our methods significantly outperforms the current state-of-the-art approaches for one class document classification.

elib-URL des Eintrags:https://elib.dlr.de/141147/
Dokumentart:Hochschulschrift (Masterarbeit)
Titel:One Class Text Classification using an Ensemble of Classifiers
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Mayaluru, Hemanth Kumar ReddyNICHT SPEZIFIZIERTNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:Januar 2020
Referierte Publikation:Ja
Open Access:Ja
Seitenanzahl:61
Status:veröffentlicht
Stichwörter:Natural language processing, text classification, autoencoders, ensemble methods
Institution:Rheinische Friedrich-Wilhelms-Universität Bonn
Abteilung:Institut für Informatik
HGF - Forschungsbereich:keine Zuordnung
HGF - Programm:keine Zuordnung
HGF - Programmthema:keine Zuordnung
DLR - Schwerpunkt:keine Zuordnung
DLR - Forschungsgebiet:keine Zuordnung
DLR - Teilgebiet (Projekt, Vorhaben):keine Zuordnung
Standort: Köln-Porz
Institute & Einrichtungen:Think Tank
Hinterlegt von: Hamm, Dr. Andreas
Hinterlegt am:26 Feb 2021 15:11
Letzte Änderung:29 Mär 2021 12:37

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.