FWF - Phase - Signalverarbeitung für die Sprachübertragung unter Berücksichtigung der Phase

Projekt: Foschungsprojekt

Projektdetails

Beschreibung

Alltägliche Sprachanwendungen, wie zum Beispiel Sprachsteuerung in der Hausautomation, Freisprechanlagen
für Mobiltelefonie oder Spracherkennung für Maschinen, sind auf zuverlässige Sprachverarbeitung
und -übertragung angewiesen. In all diese Anwendungen ist eine hohe Stabilität gegenüber
räumlich bedingtem Nachhall und Hintergrundgeräuschen notwendig. Um den störenden und unerwünschten
Einfluss von Hintergrundgeräuschen zu minimieren, ist eine Aufbereitung des Eingangssignals notwendig.
Während sich moderne Technologien f¨ur Sprachübertragung hauptsächlich auf die Filterung der Amplituden
eines Signals konzentrieren, versuchen wir über die bisherigen Möglichkeiten hinauszugehen,
indem wir zusätzlich die Phasenanteile berücksichtigen.
Dieser Beitrag gliedert sich in drei Teile: i) Entwicklung von Methoden zur Abschätzung der Phaseninformation
des ursprünglichen sauberen Quellensignals für eine qualitativ bessere Rekonstruktion
der Sprache. ii) Zweitens, die zuvor beschriebene Methode mit der Vorabinformation des Sprechers
zu erweitern. Dieses Wissen über die Identität des Anwenders kann für eine weitere Optimierung
des Sprachverbesserung verwendet werden. iii) Weiters sollen neue Gütemerkmale zur Abschätzung der
Leistungsfähigkeit von Sprachverbesserungsmethoden vorgestellt werden, die mit der menschlichen
Wahrnehmung der Qualität von Sprache stark korrelieren. Dadurch können aufwändige Hörtests vermieden
werden.
StatusAbschlussdatum
Tatsächlicher Beginn/ -es Ende1/10/1531/07/19

Publikationen

  • 12 Beitrag in einem Konferenzband
  • 5 Artikel

A Simple and Effective Framework for a Priori SNR Estimation

Stahl, J. & Mowlaee Beikzadehmahaleh, P., 2018, 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE Xplore, S. 5644-5648 5 S.

Publikation: Beitrag in Buch/Bericht/KonferenzbandBeitrag in einem Konferenzband

Overcoming Covariance Matrix Phase Sensitivity in Single-Channel Speech Enhancement with Correlated Spectral Components

Stahl, J., Wood, S. U. N. & Mowlaee Beikzadehmahaleh, P., 2018, ITG-Fb. 282: Speech Communication. VDE, S. 286-290 5 S.

Publikation: Beitrag in Buch/Bericht/KonferenzbandBeitrag in einem Konferenzband