Pleger, Roland (2022) DB-Management: Datendubletten mit Python entfernen. IX : Magazin für professionelle Informationstechnik. Heise Zeitschriften Verlag GmbH & Co KG. ISSN 0935-9680.
Full text not available from this repository.
Abstract
Relationale Datenbanken kennen keine Mehrfacheinträge. Durch Falschschreibung oder Zuordnungsfehler treten sie dennoch auf. Der Artikel erläutert, wie Python durch Ähnlichkeitssuche Falschschreibungen erkennt, ähnliche Daten kategorisiert und Daten bei der Zusammenführung von Tabellen bereinigt.
Item URL in elib: | https://elib.dlr.de/187585/ | ||||||
---|---|---|---|---|---|---|---|
Document Type: | Article | ||||||
Title: | DB-Management: Datendubletten mit Python entfernen | ||||||
Authors: |
| ||||||
Date: | September 2022 | ||||||
Journal or Publication Title: | IX : Magazin für professionelle Informationstechnik | ||||||
Refereed publication: | No | ||||||
Open Access: | No | ||||||
Gold Open Access: | No | ||||||
In SCOPUS: | No | ||||||
In ISI Web of Science: | No | ||||||
Publisher: | Heise Zeitschriften Verlag GmbH & Co KG | ||||||
ISSN: | 0935-9680 | ||||||
Status: | Published | ||||||
Keywords: | Dubletten, record linkage, Wortähnlichkeiten, Python | ||||||
HGF - Research field: | Aeronautics, Space and Transport | ||||||
HGF - Program: | Space | ||||||
HGF - Program Themes: | Space System Technology | ||||||
DLR - Research area: | Raumfahrt | ||||||
DLR - Program: | R SY - Space System Technology | ||||||
DLR - Research theme (Project): | R - Secure Digital Production Platform | ||||||
Location: | Köln-Porz | ||||||
Institutes and Institutions: | Institute for Software Technology | ||||||
Deposited By: | Pleger, Dr.-Ing. Roland | ||||||
Deposited On: | 13 Sep 2022 08:06 | ||||||
Last Modified: | 30 Sep 2022 13:13 |
Repository Staff Only: item control page