FWF - Markov - Informationstheoretische Aggregation von Markov-Ketten

Projekt: Foschungsprojekt

Projektdetails

Beschreibung

Markov-Modelle sind wichtige mathematische Modelle für Zufallsprozesse und werden in vielen Wissenschaftsdisziplinen eingesetzt. Sie dienen als Werkzeuge in der Nachrichtentechnik, der Genetik und der Systembiologie, in der Sprachverarbeitung und im maschinellen Lernen. In einigen dieser Anwendungsgebiete sind die Modelle allerdings zu groß, um sinnvoll eingesetzt werden zu können. Einerseits kann es unmöglich werden, ein gegebenes Markov-Modell zu simulieren, andererseits reichen oft die vorhandenen Daten nicht aus um die Parameter des Modells zu bestimmen. Es ist daher in diesen Wissenschaftsdisziplinen erforderlich, die vorhandenen Modelle zu vereinfachen.

Das Ziel des Forschungsaufenthalts ist, Markov-Modelle mithilfe informationstheoretischer Methoden zu aggregieren. Aggregation bedeutet in diesem Zusammenhang dass einzelne Zustände des ursprünglichen Modells zu einem einzigen Zustand zusammengefasst werden – in der Sprachverarbeitung würde man z.B. die Wörter „forschen“, „beantragen“ und „hoffen“ zu „Verben“ zusammenfassen. Die Vereinfachung von Markov-Modellen wurde in den letzten Jahren zwar immer populärer, doch werden informationstheoretische Methoden immer noch zögerlich eingesetzt. Aber was sind informationstheoretische Methoden? Die Informationstheorie beschäftigt sich mit der Übertragung von Information und deren mathematischer Grundlage. Markov-Modelle mithilfe informationstheoretischer Methoden zu aggregieren bedeutet also, salopp ausgedrückt, das Modell zu vereinfachen und dabei so wenig Information wie möglich zu zerstören.

Während des Forschungsaufenthalts werden wir nicht nur theoretische Resultate erarbeiten, sondern auch Algorithmen entwerfen, die ein gegebenes Markov-Modell vereinfachen. Die Anwendungsmöglichkeiten solcher Algorithmen sind enorm: Konkret hoffen wir, den Viterbi-Algorithmus, einen wichtigen Algorithmus in der Nachrichtentechnik, zu vereinfachen. Außerdem wollen wir, vor allem während der Rückkehrphase in Österreich, unsere Ergebnisse und Methoden in der Sprachverarbeitung einsetzen.
StatusAbschlussdatum
Tatsächlicher Beginn/ -es Ende9/11/1515/06/18