
Erscheinungsbasierte Personenwiedererkennung mit Mehrsichtinformationen von Fischaugenkameras
Dokumentinformationen
Autor | Gregor Blott |
instructor | Prof. Dr.-Ing. Christian Heipke |
Schule | Leibniz Universität Hannover |
Fachrichtung | Geodäsie und Geoinformatik |
Veröffentlichungsjahr | 2020 |
Ort | München |
Dokumenttyp | dissertation |
Sprache | German |
Seitenanzahl | 125 |
Format | |
Größe | 4.75 MB |
- Personenwiedererkennung
- Kameranetzwerke
- Tiefes Lernen
Zusammenfassung
I. Einleitung
Die erscheinungsbasierte Personenwiedererkennung ist ein zentrales Thema in der modernen Bildverarbeitung und spielt eine entscheidende Rolle in verschiedenen Anwendungen, insbesondere in Überwachungssystemen und der Automatisierungstechnik. Die vorliegende Dissertation von Gregor Blott untersucht die Herausforderungen und Fortschritte in diesem Bereich. Ein zentrales Problem ist die hohe Variabilität des Erscheinungsbildes von Personen, die durch unterschiedliche Lichtverhältnisse, Bekleidungswechsel und andere Faktoren beeinflusst wird. Diese Variabilität führt zu Schwierigkeiten bei der Personenidentifikation über verschiedene Kameras hinweg. Die Arbeit präsentiert einen innovativen Ansatz, der die Nutzung von Fischaugenkameras in den Mittelpunkt stellt, um mehrere Ansichten einer Person zu erfassen und somit die Wiedererkennung zu verbessern. Die Ergebnisse zeigen, dass die Verwendung von Multi-View-Informationen die Leistung der Personenwiedererkennung signifikant steigert, was für die praktische Anwendung von großer Bedeutung ist.
1.1 Motivation
Die Motivation hinter dieser Forschung liegt in der Notwendigkeit, die Wiedererkennungsleistung in realen Szenarien zu verbessern. Trotz der Fortschritte in der Technologie bleibt die Personenwiedererkennung in komplexen Umgebungen eine Herausforderung. Die Dissertation hebt hervor, dass die herkömmlichen Ansätze oft an ihre Grenzen stoßen, wenn es darum geht, Personen unter variierenden Bedingungen zu identifizieren. Die Verwendung von Fischaugenkameras bietet eine vielversprechende Lösung, da sie eine umfassendere Sicht auf die Szene ermöglichen und somit die Variabilität der Beobachtungen erhöhen. Diese Erkenntnisse sind nicht nur für die akademische Gemeinschaft von Interesse, sondern auch für Unternehmen, die in den Bereichen Sicherheit und Überwachung tätig sind.
II. Methodik
Die Methodik dieser Dissertation basiert auf einem neuartigen Pipeline-Ansatz, der die Verarbeitung von Bildern aus Fischaugenkameras optimiert. Die Arbeit beschreibt detailliert, wie geometrische Sensormodellierung und Deep Learning kombiniert werden, um die Multi-View-Informationen effektiv zu nutzen. Ein wichtiger Aspekt ist die Entwicklung eines generischen Moduls, das flexibel an verschiedene Feature-Extraktionsmethoden angepasst werden kann. Diese Flexibilität ermöglicht es, die Wiedererkennungsleistung unabhängig von der Menge der Trainingsdaten zu steigern. Die Dissertation präsentiert auch umfangreiche experimentelle Evaluierungen, die die Wirksamkeit des vorgeschlagenen Ansatzes belegen. Die Ergebnisse zeigen, dass die Multi-View-Beobachtungen die Inter-Kamera-Wiedererkennung erheblich verbessern, was die Relevanz dieser Forschung für die Praxis unterstreicht.
2.1 Datenverarbeitung
Die Datenverarbeitung erfolgt durch die Implementierung eines Pipeline-Systems, das speziell für die Verarbeitung von Fischaugenbildern entwickelt wurde. Die Dissertation erläutert die Schritte von der Bildakquisition bis zur Personenidentifikation. Ein zentraler Punkt ist die Nutzung von domänenspezifischem Vorwissen, das es ermöglicht, die geometrischen Verzerrungen der Fischaugenkameras zu kompensieren. Diese Vorgehensweise verbessert nicht nur die Bildqualität, sondern auch die Genauigkeit der Wiedererkennung. Die Ergebnisse der Experimente belegen, dass die Kombination aus Deep Learning und geometrischer Modellierung zu einer signifikanten Steigerung der Wiedererkennungsgenauigkeit führt.
III. Ergebnisse und Diskussion
Die Ergebnisse der Dissertation zeigen, dass die Verwendung von Fischaugenkameras in der personenbasierten Wiedererkennung erhebliche Vorteile bietet. Die Analyse der experimentellen Daten belegt, dass die Multi-View-Technik die Wiedererkennungsleistung signifikant steigert. Ein bemerkenswerter Aspekt ist, dass die Verbesserung unabhängig von der Anzahl der Trainingsdaten auftritt. Dies deutet darauf hin, dass der vorgeschlagene Ansatz nicht nur theoretisch fundiert, sondern auch praktisch anwendbar ist. Die Dissertation diskutiert auch die Implikationen dieser Ergebnisse für zukünftige Forschungsrichtungen und die Entwicklung von Überwachungssystemen. Die Erkenntnisse sind von großer Bedeutung für die Weiterentwicklung von Technologien zur Personenidentifikation in komplexen Umgebungen.
3.1 Praktische Anwendungen
Die praktischen Anwendungen der Forschung sind vielfältig. Die Ergebnisse können in verschiedenen Bereichen eingesetzt werden, darunter Sicherheitsüberwachung, Automatisierungstechnik und Verhaltensanalyse im Einzelhandel. Die Fähigkeit, Personen aus verschiedenen Blickwinkeln zu identifizieren, eröffnet neue Möglichkeiten für die Entwicklung intelligenter Überwachungssysteme, die in der Lage sind, präzise und zuverlässig zu arbeiten. Die Dissertation schließt mit einem Ausblick auf zukünftige Entwicklungen und die Notwendigkeit weiterer Forschung, um die Wiedererkennungstechnologien weiter zu optimieren und an die sich ständig ändernden Anforderungen der Praxis anzupassen.
Dokumentreferenz
- Multi-View Person Re-Identification (Gregor Blott)
- Wissenschaftliche Arbeiten der Fachrichtung Geodäsie und Geoinformatik der Universität Hannover
- Institute of Photogrammetry and GeoInformation (IPI), Leibniz Universität Hannover (Prof. Dr.-Ing. Christian Heipke)
- Computer Vision Research Lab (CV Lab) of the Robert Bosch GmbH, Hildesheim
- i.c.sens research training group