Combining Descriptive and Discriminative Information for Person Re-Identification

Titel in Übersetzung: Kombination von Deskriptiven und Diskriminativen Informationen zur Personenwiedererkennung

Martin Hirzer

Publikation: StudienabschlussarbeitDissertation

Abstract

Die Wiedererkennung von Personen in Kameranetzwerken zählt zu den Kernaufgaben vieler visueller Überwachungssysteme. Ausgehend von der Sichtung einer gesuchten Person in einem Kamerabild, sollen möglichst rasch sämtliche Erscheinungen derselben Person in weiteren Kameras des Netzwerkes gefunden werden. Sowohl für Menschen als auch für automatische Systeme stellt dies eine äußerst schwierige Aufgabe dar, da sich die Abbildung einer Person zwischen zwei verschiedenen Kameras sehr stark unterscheiden kann, beispielsweise aufgrund von Veränderungen im Blickwinkel, der Körperhaltung und der Beleuchtung. Viele der existierenden Systeme zur automatischen Personensuche setzen daher entweder auf eine deskriptive Strategie, versuchen also eine robuste, ganzheitliche Personenbeschreibung zu generieren, oder verfolgen einen diskriminativen Ansatz, um spezifische Details einer bestimmten Person zu extrahieren. Da diese beiden komplementären Richtungen ganz unterschiedliche Aspekte eines Personenbildes erfassen können, schlagen wir in dieser Dissertation vor, beide für die Personensuche zu verwenden.
Um dies zu erreichen, stellen wir zuerst einen anwendungsorientierten Ansatz vor, der beide Strategien in einem System vereint. Wird eine Person zur Suche ausgewählt, so beginnen wir mit einem schnellen, deskriptiven Suchverfahren, bei dem verschiedene visuelle Merkmale mit Hilfe einer Kovarianzbeschreibung erfasst werden. Dadurch ist es unserem System möglich, dem Benutzer sehr rasch ein erstes Suchergebnis zu präsentieren. Falls nötig, kann dieses Ergebnis in einem zweiten Schritt dann noch weiter verfeinert werden. Dazu verwenden wir ein auf Boosting basierendes, diskriminatives Suchverfahren. Bezogen auf das Gesamtsystem bedeutet diese zweistufige Vorgehensweise, dass wir sowohl die geringere Rechenzeit des deskriptiven, als auch die höhere Genauigkeit des diskriminativen Modells ausnutzen können.
Im zweiten Teil dieser Dissertation beschäftigen wir uns mit verschiedenen Metrik-Lernverfahren, einem relativ neuen Forschungsgebiet im Bereich der visuellen Personenwiedererkennung. Obwohl Metrik-Lernverfahren eine sehr elegante und mathematisch fundierte Verbindung von deskriptiven und diskriminativen Techniken erlauben, so sind die meisten vorhandenen Ansätze nicht an die speziellen Herausforderungen, die bei der Personensuche auftreten, angepasst und benötigen darüber hinaus noch eine hohe Rechenleistung. Um diese Einschränkungen zu beseitigen und damit die praktische Anwendbarkeit der Lernverfahren zu erhöhen, untersuchen wir in dieser Arbeit Methoden zum Lernen von Metriken die nicht nur sehr viel effizienter, sondern auch robuster sind als existierende Ansätze.
Im letzten Teil demonstrieren wir schließlich die Vorteile unserer kombinierten Strategie auf mehreren öffentlich zugänglichen Personendatenbanken unterschiedlicher Komplexität. Die Ergebnisse zeigen, dass sich die komplementären Aspekte, die von deskriptiven und diskriminativen Modellen beschrieben werden, äußerst nutzbringend miteinander verbinden lassen. Dies trifft im Besonderen auf Metrik-Lernverfahren zu, welche nicht nur hervorragende Resultate erzielen, sondern im Vergleich zu anderen Ansätzen auf dem Gebiet der visuellen Personenwiedererkennung auch um ein Vielfaches effizienter sind.
Titel in ÜbersetzungKombination von Deskriptiven und Diskriminativen Informationen zur Personenwiedererkennung
Originalspracheenglisch
PublikationsstatusVeröffentlicht - 2014

Fields of Expertise

  • Information, Communication & Computing

Dieses zitieren