FWF - Multiparameter Homology - Persistente Homologie für mehrere Parameter

Projekt: Foschungsprojekt

Projektdetails

Beschreibung

Eine große Herausforderung der heutigen Zeit ist die Untersuchung von komplexen Daten, deren Inhalt oftmals im Verborgenen liegt. Stellen Sie sich zum Beispiel vor, Sie haben eine Gruppe von Corona-Infizierten und wissen, ob und wie lange je zwei Infizierte Kontakt zueinander hatten.
Zur Nachverfolgung der Infektionen wollen Sie nun Cluster von
Infizierten bilden. Dafür könnten Sie z.B. sagen, dass zwei Personen im gleichen Cluster sind, falls sie mindestens 10 Minuten Kontakt hatten. Allerdings könnte sich das Ergebnis deutlich unterscheiden, wenn Sie statt 10 Minuten 20 oder auch nur 5 Minuten als Mindestkontaktzeit nehmen. Die Kontaktzeit ist ein Beispiel für einen Parameter: ein Wert, welcher das Gesamtergebnis beeinflusst und welchen wir frei wählen können.

Es ist sinnvoll, alle möglichen Parameterwerte in Betracht zu ziehen und zu untersuchen, wie sich die Cluster verändern, wenn man den Parameter ändert. Anstatt Cluster zu bilden, können wir auch andere Eigenschaften untersuchen, zum Beispiel das Vorkommen von "Löchern" in den Daten. Die persistente Homologie ist eine mathematische Theorie, die untersucht, wie sich topologische Eigenschaften (z.B. Cluster oder Löcher) ändern, wenn sich der Parameter ändert.

Bei der Untersuchung von Daten ist man jedoch nicht auf einen einzelnen Parameter beschränkt. Um im Beispiel zu bleiben, kann man vielleicht weitere Rückschlüsse aus den Daten herauslesen, wenn man nur symptomatische oder schwer erkrankte Personen in Betracht zieht. Wir haben nun also zwei Parameter: Schwere der Erkrankung und Dauer des Kontaktes, und bekommen für jede Wahl andere Cluster. Auch hier stellt sich die Frage, wie sich diese Cluster entwickeln, wenn wir die Parameter ändern. Diese Erweiterung nennt sich persistente Homologie mit mehreren Parametern.

Beim Übergang von einem auf mehrere Parameter entsteht ein Problem: Die mathematische Beschreibung des Analyseobjektes (im Beispiel oben: die Gesamtheit aller Cluster über alle Wahlen von Kontaktzeiten und Schwere der Erkrankung) erlaubt keine einfache Darstellung, was die Interpretation erschwert. Dennoch wurden in den letzten Jahren einige Durchbrüche erzielt, die eine Untersuchung von Daten mit mehreren Parametern in Aussicht stellen. Oftmals beschränken sich diese Arbeiten jedoch auf eine rein mathematische Sichtweise und vernachlässigen den Aspekt der praktischen Durchführbarkeit auf einem Computer.

Das Ziel dieses Projektes ist die Entwicklung von Werkzeugen (d.h. Computerprogrammen), um diese Multiparameteruntersuchung auf großen Datensätzen durchführen zu können. Dafür wird neben der Erstellung und Implementierung schneller Algorithmen auch die mathematische Struktur der untersuchten Objekte eine Rolle spielen. Wir erwarten, dass die Ergebnisse des Projektes Verwendung in der anwendungsorientierten Forschung finden werden.
StatusNicht begonnen
Tatsächlicher Beginn/ -es Ende1/08/2131/07/25