Baltzer, Christian (2020) Digitale Tabellenerfassung: Tabellenextraktion durch Bildverarbeitung und künstliche Intelligenz. Bachelorarbeit, Hochschule Fulda.
PDF
1MB |
Kurzfassung
Im Rahmen dieser Bachelorarbeit wurde, in Zusammenarbeit mit dem Deutschen Zentrum für Luft und Raumfahrt, eine Methode gefunden, Tabellen in digitalisierten Dokumenten zu finden und in ein maschinenlesbares Format zu bringen. Da hierfür bei Recherchen weder eine Lösung in Form von klassischen Algorithmen, wie der Bildverarbeitung, noch eine nutzbare Lösung in Form von neuronalen Netzen gefunden werden konnte, wurde eine neue Methode entwickelt. Hierfür wurde die Aufgabe in verschiedene Probleme, wie die Tabellen- und Schrifterkennung, aufgeteilt. Um diese zu lösen, wurden Methoden der künstlichen Intelligenz in Form des YOLO Netzes, bestehende OCR Lösungen und eigene Algorithmen genutzt. Dabei konnten alle Probleme gelöst werden und das Ergebnis wurde in einem funktionstüchtigen Prototyp umgesetzt.
elib-URL des Eintrags: | https://elib.dlr.de/136220/ | ||||||||
---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Hochschulschrift (Bachelorarbeit) | ||||||||
Titel: | Digitale Tabellenerfassung: Tabellenextraktion durch Bildverarbeitung und künstliche Intelligenz | ||||||||
Autoren: |
| ||||||||
Datum: | 20 September 2020 | ||||||||
Referierte Publikation: | Nein | ||||||||
Open Access: | Ja | ||||||||
Seitenanzahl: | 55 | ||||||||
Status: | veröffentlicht | ||||||||
Stichwörter: | Datenextraktion, Tabellen, Maschine Learning | ||||||||
Institution: | Hochschule Fulda | ||||||||
Abteilung: | Fachbereich Angewandte Informatik (AI) | ||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||
HGF - Programm: | Raumfahrt | ||||||||
HGF - Programmthema: | keine Zuordnung | ||||||||
DLR - Schwerpunkt: | Raumfahrt | ||||||||
DLR - Forschungsgebiet: | R - keine Zuordnung | ||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | R - keine Zuordnung | ||||||||
Standort: | Jena | ||||||||
Institute & Einrichtungen: | Institut für Datenwissenschaften > Sichere Digitale Systeme | ||||||||
Hinterlegt von: | Peters, Diana | ||||||||
Hinterlegt am: | 25 Sep 2020 09:27 | ||||||||
Letzte Änderung: | 25 Sep 2020 09:27 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags