FWF - CLCS_2 - Cross-layer Prosodie Modelle für Spontansprache

Projekt: Foschungsprojekt

Projektdetails

Beschreibung

Systeme zur automatischen Spracherkennung wurden ursprünglich so entwickelt dass sie mit sorgfältig artikulierter Sprache umgehen können. Die meisten Anwendungen von automatischen Spracherkennern erfordern jedoch die Erkennung von Spontansprache (z.B. Spracheingabehilfsmittel für körperlich Behinderte, Sprachdialogsysteme, medizinische Diktiersysteme, etc.). Im Vergleich zur gelesenen Sprache unterscheidet sich die Spontansprache unter anderem durch eine hohe Frequenz von Äußerungen die als "ungrammatikalisch" erachtet werden könnten und durch das Auftreten von Reformulierungen und Wortwiederholungen wie z.B. in ...hmm, naja..ich glaube, weisst eh... Das Wort haben wird in alltäglichen, informellen Situationen z.B. eher als ham ausgesprochen. Diese Aussprachevariation hängt von gut untersuchten Faktoren wie regionaler Herkunft, Sprachsituation und Worthäufigkeit ab. Eine noch wenig untersuchte Kategorie von Faktoren sind die prosodischen Eigenschaften des Wortes im Satz. Solche prosodischen Eigenschaften beschreiben den Sprachrhythmus und die Sprachmelodie des Satzes und z.B. ob ein Wort betont wird oder nicht. Das Ziel dieses Projektes ist es, interdisziplinäre Methoden (linguistische, phonetische und sprach-technologische) für die Modellierung der prosodischen Faktoren für Aussprachevariation zu entwickeln und so Spracherkenner für Spontansprache zu verbessern. Dafür verwenden wir Sprachmaterial von Deutschen und Österreichischen Sprechern.
Im Gegensatz zu den meisten Studien im Bereich Prosodie, welche gelesene oder gut vorbereitete Laborsprache verwendet haben, werden wir unvorbereitete Dialoge zu alltäglichen Themen zwischen Gesprächspartnern die sie gut kennen (d.h. Spontansprache) untersuchen. Derartiges Sprachmaterial ist nicht nur natürlicher, sondern auch reicher an Aussprachevariation. Im geplanten Projekt werden wir die erste prosodisch annotierte Sprachdatenbank für spontanes Österreichisches Deutsch erstellen welche danach gemeinsam mit den automatischen Werkzeugen zu deren Annotation auch anderen Forschern zur Verfügung gestellt wird. Weiters werden die gewonnenen Erkenntnisse in Modelle in einen prosodie-abhängigen Spracherkenner für Spontansprache von Deutschen und Österreichischen Sprechern integriert.
StatusLaufend
Tatsächlicher Beginn/ -es Ende1/10/1830/09/21