Wir haben alle schon einmal nach persönlichen Gegenständen oder nach dem richtigen Weg in einer uns
unbekannten Umgebung gesucht. Technische Lösungen einer adäquaten Hilfestellung für unsere Wahrnehmung
sind noch in weiter Ferne. Der nun bewilligte FSP "Kognitives Sehen" beschäftigt sich genau mit dieser Thematik.
Der Mensch soll durch ein Sehsystem unterstützt werden, das nicht nur Dinge finden kann, sondern auch die
Zusammenhänge zwischen seinen Tätigkeiten und den Dingen versteht. Dieses Verstehen von neuer Information
und neuem Wissen ist der Kernpunkt des kognitiven Ansatzes der Bildverarbeitung.
Die vorgeschlagenen Lösungswege basieren auf einem trans-disziplinären Ansatz. So sind Partner eingebunden aus
der theoretischen Informatik (TU Graz), Neurowissenschaft (Max-Planck-Institut Tübingen), künstlichen
Intelligenz (ÖFAI, Wien), dem maschinellen Lernen (MU Leoben), der benutzer-orientierten Systemanalyse
(CURE, Wien) als auch verschiedener Bereiche der Bildverarbeitung (ACIN & PRIP TU Wien, EMT & ICG TU
Graz und Joanneum Research Graz).
Ein Ansatzpunkt ist die Untersuchung des Zusammenspiels der verschiedenen Hirnregionen des Sehzentrums.
Während einzelne Funktionen relativ gut untersucht sind, ermöglichen neue Analysemethoden tiefere Einblicke, die
bekannte Hypothesen umstoßen. So ist für das menschliche Sehen die Erwartungshaltung enorm wichtig. Zum
Beispiel werden Gegenstände, die nicht in eine Umgebung passen, sehr viel schneller erkannt als in dieser
Umgebung übliche Objekte.
Aus dieser Untersuchung des einzigen "wirklich funktionierenden" Sehsystems, werden nun Computermodelle
entwickelt, um Gegenstände unter den verschiedensten Rahmenbedingungen, etwa bei Beleuchtungs-, Farb- und
Formänderungen oder teilweiser Verdeckung, aber auch gegenstand-spezifische Zusammenhänge und Funktionen
zu beschreiben. Ein wesentlicher Schwerpunkt ist das Erlernen dieser Modelle und Zusammenhänge. So wie man
einem Kind einen neuen Gegenstand zeigt, so soll auch dem Benutzer die derzeit noch langwierige Einlernphase
abgenommen werden.
Ein weiterer Ansatzpunkt der Forschungsarbeiten ist die Analyse des Zusammenspiels der einzelnen Funktionen
des Sehens, insbesondere von Mechanismen zur Lenkung der Aufmerksamkeit, des Entdeckens und Identifizierens
von Gegenständen, der Vorhersage von Bewegungen und Absichten des Benutzers, der Einbindung von Wissen
über eine gegebene Situation, und der Entwicklung einer entsprechenden Reaktion des Systems. Die Koordination
dieser Aufgaben erfolgt durch eine agenten-basierte Auslotung des Nutzens für die Gesamtfunktion.
Die entwickelten Techniken werden in Prototypen eingebaut. In einer Studie wird abgeschätzt wie nahe das System
den Erwartungen des Benutzers kommt. Ziel der nächsten drei Jahre ist es mitzuverfolgen, welche Objekte wo
platziert wurden und Orte in einer bekannten Umgebung zu finden. So könnte der Benutzer das System fragen, wo
sein Kaffeehäferl ist oder wo sich ein Geschäft in einer ihm nicht bekannten Strasse befindet. In beiden Fällen
bekäme er Unterstützung und würde hingeführt.