Enderling, Maximilian (2022) Erstellung einer nutzergestützten Anwendung zur Optimierung von phrasenbasierten Spracherkennungslösungen und deren Anwendung am Beispiel der FieldMApp-Spracherkennung. Bachelorarbeit, Friedrich-Schiller-Universität Jena.
PDF
- Nur DLR-intern zugänglich
958kB |
Kurzfassung
In der vorliegenden Arbeit wird eine Lösung vorgestellt, die Entwerfende der Phrasenmengen von phrasenbasierten Spracherkennungssystemen beim Optimieren der Erkennungsgüte unterstützten soll. Dabei müssen Phrasenmengen mit mehreren Millionen Elementen berücksichtigt werden. Eine schlechte Erkennungsgüte entsteht durch Verwechselungen zwischen Wörtern. Deshalb suchen wir die am ähnlichsten klingenden Phrasenpaare mittels Locality-Sensitive-Hashing und einem phonetischen Abstandsmaß. Diese Suche wird auf einem zentralen Server ausgeführt. Anschließend werden die gefundenen Phrasenpaare zusammen mit den in der Phrasenmenge vorkommenden einzelnen Worten auf die tatsächliche Erkennungsgüte überprüft. Dies geschieht durch Auswertung von Sprachaufnahmen, die mittels einer dafür entwickelten, mobilen Anwendung dezentral und mit minimalem Aufwand von mehreren Personen gesammelt wurden. Eine Auswertung lässt vermuten, dass das genutzte phonetische Abstandsmaß nicht viel Aussagekraft hat. Die entstandene Gesamtlösung ist jedoch eine gute Basis für Weiterentwicklung.
elib-URL des Eintrags: | https://elib.dlr.de/192729/ | ||||||||
---|---|---|---|---|---|---|---|---|---|
Dokumentart: | Hochschulschrift (Bachelorarbeit) | ||||||||
Titel: | Erstellung einer nutzergestützten Anwendung zur Optimierung von phrasenbasierten Spracherkennungslösungen und deren Anwendung am Beispiel der FieldMApp-Spracherkennung | ||||||||
Autoren: |
| ||||||||
Datum: | 2022 | ||||||||
Referierte Publikation: | Nein | ||||||||
Open Access: | Nein | ||||||||
Status: | veröffentlicht | ||||||||
Stichwörter: | speech recognition, optimization | ||||||||
Institution: | Friedrich-Schiller-Universität Jena | ||||||||
Abteilung: | Fakultät für Mathematik und Informatik | ||||||||
HGF - Forschungsbereich: | Luftfahrt, Raumfahrt und Verkehr | ||||||||
HGF - Programm: | Raumfahrt | ||||||||
HGF - Programmthema: | keine Zuordnung | ||||||||
DLR - Schwerpunkt: | Raumfahrt | ||||||||
DLR - Forschungsgebiet: | R - keine Zuordnung | ||||||||
DLR - Teilgebiet (Projekt, Vorhaben): | R - keine Zuordnung | ||||||||
Standort: | Jena | ||||||||
Institute & Einrichtungen: | Institut für Datenwissenschaften > Datengewinnung und -mobilisierung | ||||||||
Hinterlegt von: | Klan, Dr. Friederike | ||||||||
Hinterlegt am: | 17 Jan 2023 13:17 | ||||||||
Letzte Änderung: | 17 Jan 2023 13:17 |
Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags