Pleger, Roland (2022) DB-Management: Datendubletten mit Python entfernen. IX : Magazin für professionelle Informationstechnik. Heise Zeitschriften Verlag GmbH & Co KG. ISSN 0935-9680.
Dieses Archiv kann nicht den Volltext zur Verfügung stellen.
Kurzfassung
Relationale Datenbanken kennen keine Mehrfacheinträge. Durch Falschschreibung oder Zuordnungsfehler treten sie dennoch auf. Der Artikel erläutert, wie Python durch Ähnlichkeitssuche Falschschreibungen erkennt, ähnliche Daten kategorisiert und Daten bei der Zusammenführung von Tabellen bereinigt.
elib-URL des Eintrags: | https://elib.dlr.de/187585/ | ||||||||
---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Zeitschriftenbeitrag | ||||||||
Titel: | DB-Management: Datendubletten mit Python entfernen | ||||||||
Autoren: |
| ||||||||
Datum: | September 2022 | ||||||||
Erschienen in: | IX : Magazin für professionelle Informationstechnik | ||||||||
Referierte Publikation: | Nein | ||||||||
Open Access: | Nein | ||||||||
Gold Open Access: | Nein | ||||||||
In SCOPUS: | Nein | ||||||||
In ISI Web of Science: | Nein | ||||||||
Verlag: | Heise Zeitschriften Verlag GmbH & Co KG | ||||||||
ISSN: | 0935-9680 | ||||||||
Status: | veröffentlicht | ||||||||
Stichwörter: | Dubletten, record linkage, Wortähnlichkeiten, Python | ||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||
HGF - Programm: | Raumfahrt | ||||||||
HGF - Programmthema: | Technik für Raumfahrtsysteme | ||||||||
DLR - Schwerpunkt: | Raumfahrt | ||||||||
DLR - Forschungsgebiet: | R SY - Technik für Raumfahrtsysteme | ||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | R - Sichere Digitale Produktionsplattform | ||||||||
Standort: | Köln-Porz | ||||||||
Institute & Einrichtungen: | Institut für Softwaretechnologie | ||||||||
Hinterlegt von: | Pleger, Dr.-Ing. Roland | ||||||||
Hinterlegt am: | 13 Sep 2022 08:06 | ||||||||
Letzte Änderung: | 30 Sep 2022 13:13 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags