CLCS - Cross-layer Aussprachemodelle für Spontansprache (FWF Hertha Firnberg Program T572)

Projekt: Foschungsprojekt

Beschreibung

Systeme zur automatischen Spracherkennung wurden ursprünglich so entwickelt, dass sie mit sorgfältig artikulierter Sprache umgehen können. In Folge dessen können diese Systeme nicht gut mit der gewaltigen Aussprachevariation, die für spontane Alltagssprache üblich ist, umgehen. Gelesene und spontane Sprache unterscheiden sich in vielen Aspekten. Die charakteristischen Eigenschaften der Spontansprache sind, unter anderem, eine hohe Frequenz von Äußerungen, die als "ungrammatikalisch" erachtet werden könnten, und das Auftreten von Reformulierungen und Wortwiederholungen. In phonetischer Hinsicht ist ein viel höheres Maß an Aussprachevariation in der spontanen als in der gelesenen Sprache zu beobachten. In der Spontansprache sind die Worte im Vergleich zu ihrer Standardaussprache häufig akustisch reduziert, sodass zum Beispiel das Wort haben wie ham ausgesprochen sein kann. Da die meisten Anwendungen von automatischen Spracherkennern jedoch die Erkennung von Spontansprache erfordern (z.B. Spracheingabehilfsmittel für körperlich Behinderte, medizinische Diktiersysteme, Sprachdialogsysteme etc.), ist die Entwicklung von Methoden, die die Integrierung von Aussprachevariation ermöglichen, ein wichtiges Forschungsthema im Bereich der Sprachtechnologie.
Auch phonetische, sprachwissenschaftliche und psycholinguistische Studien analysieren spontane Gespräche auf der Suche nach einer Antwort darauf, welchen Regeln die Produktion und Perzeption von Sprache in alltälglichen Situtationen unterliegen. Studien, die auf großen Sprachkorpora beruhen, haben gezeigt, dass die Details der phonetischen Realisierung mit den grammatikalischen und funktionellen Eigenschaften einer Aussage in Zusammenhang stehen. Es ist wahrscheinlich, dass die neuen Möglichkeiten zur quantitativen Analyse noch weitere Faktoren ans Tageslicht bringen, die die Aussprachevariation beeinflussen.
Das vorliegende Projekt hat zum Ziel die grammatikalischen Bedingungen für das Auftreten von phonetischen Prozessen in Spontansprache mit Hilfe von quantitativen Methoden zu bestimmen und dieses erlangte Wissen zu verwenden um einen automatischen Spracherkenner zu verbessern. Die meisten Spracherkenner behandeln die akustischen und sprachstrukturellen Eigenschaften unabhängig voneinander. Im Rahmen dieses Projektes soll untersucht werden, ob sich diese Systeme verbessern, wenn sie die Wechselwirkungen zwischen diesen Ebenen mitberücksichtigen ("cross-layer"). Für diese Untersuchungen wird niederländisches und österreichisches Sprachmaterial herangezogen um sprachspezifische von sprachübergreifenden Phänomenen zu differenzieren. Sowohl das erstellte Sprachmaterial als auch die Softwareprogramme zur automatischen phonetischen und morpho-syntaktischen Transkription, die im Rahmen dieses Projektes entwickelt würden, stünden zukünftigen sprachwissenschaftlichen und technischen Studien zur Verfügung.
StatusAbschlussdatum
Tatsächlicher Beginn/ -es Ende1/09/1230/04/17