FWF-VAD - Visuelle Analyse Heterogener Daten mit Semantischen Subsets

  • Lex, Alexander, (Teilnehmer (Co-Investigator))

Projekt: Foschungsprojekt

Projektdetails

Beschreibung

Die Analyse sehr großer und heterogener Datensätze ist ein fundamentales Problem dem Forscher in vielen
wissenschaftlichen Domänen gegenüberstehen. In Bereichen wie zum Beispiel Astronomie, Physik und Biologie
müssen Datensätze von nie dagewesener Größe und Komplexität untersucht werden. Obwohl die Analyse solcher
Datensätze herausfordernd ist, haben sie auch das Potential unser Wissen über die zugrundeliegenden Prozesse zu
revolutionieren.
Um jedoch dieses Potential nutzen zu können bedarf es neuartiger Ansätze in allen Bereichen der Datenanalyse. In
diesem Antrag für ein Erwin Schrödinger Stipendium führe ich Semantic Subsets als neue Technik für die visuelle
Analyse von mehreren großen und heterogenen Datensätzen ein. Ich schlage vor, unter anderem durch den Einsatz
von maschinellem Lernen und Statistik, Datensätze zunächst in sinnvolle Teilmengen zu zerlegen, um danach
Visualisierungsmethoden zu nutzen um Experten bei der Auswahl der für die Aufgabe relevanter Subsets zu
unterstützen. Diese Subsets, sowie die Beziehungen zwischen den Subsets werden dann visualisiert, was eine
offene, explorative Analyse ermöglicht. Die zentralen Forschungsfragen die in diesem Antrag behandelt werden
beschäftigen sich mit Methoden um effizient und effektiv passende Subsets zu finden, sie zu verwalten und die
Beziehungen zwischen ihnen darzustellen.
Ich behaupte, dass dieser Ansatz geeignet ist die Herausforderungen, welche die Analyse mehrerer großer
Datensätze mit sich bringt, zu adressieren, da der Ansatz einerseits gut skaliert und andererseits auf natürliche Art
mehrere Datensätze integriert.
Ich plane Prototypen, die das Semantic Subsets Konzept umsetzen, für die Analyse biomolekularer Daten im Zuge
von Design Studien zu entwickeln. Diese Prototypen werden aus einem benutzerzentrierten Entwicklungsprozess
heraus entstehen, was enge Zusammenarbeit mit Fachexperten notwendig macht. Die Anwendungen werden auf
die Datenanalyseprobleme der Experten zugeschnitten sein und sie im wissenschaftlichen Erkenntnisprozess
unterstützen. Die formale Evaluierung der Anwendbarkeit der Methode wird mithilfe von Fallstudien, die auf
langfristigen Beobachtungen der entwickelten Applikationen basieren, vorgenommen. Außerdem werden
kontrollierte Benutzerstudien durchgeführt.
Ich plane, diese Forschung in der Visual Computing Group an der Harvard University, welche von Professor
Hanspeter Pfister geleitet wird, durchzuführen. Professor Pfister und seine Arbeitsgruppe haben weitreichende
Erfahrung mit der Entwicklung von Visualisierungsmethoden für die molekulare Biologie. Zusätzlich bietet Boston
und Umgebung Zugang zu zahlreichen hochkarätigen Forschungseinrichtungen im Bereich der molekularen
Biologie, wie zum Beispiel der Harvard Medical School und dem Broad Institute of MIT and Harvard, zu welchen
Professor Pfister und ich Beziehungen pflegen. Diese Umgebung ist daher besonders geeignet für die
vorgeschlagene Art der Forschung.
Im Zuge der geplanten Rückkehrphase am Institut für Maschinelles Sehen und Darstellen an der Technischen
Universität Graz werde ich nicht nur die Möglichkeit haben mein gewonnenes Wissen meinen Kollegen und
Studenten weiterzugeben, sondern auch Professor Schmalstieg dabei unterstützen können seine Forschungsgruppe
im Bereich der Visualisierung auszubauen, um damit den Forschungsschwerpunkt Visualisierung in Österreich zu
stärken.
StatusAbschlussdatum
Tatsächlicher Beginn/ -es Ende1/06/1531/05/16