
Wahrscheinliche Pose-Schätzung und 3D-Rekonstruktion von Fahrzeugen aus Stereo-Bildern
Dokumentinformationen
Autor | Maximilian Alexander Coenen |
Schule | Gottfried Wilhelm Leibniz Universität Hannover |
Fachrichtung | Geodäsie und Geoinformatik |
Veröffentlichungsjahr | 2020 |
Ort | München |
Dokumenttyp | dissertation |
Sprache | German |
Seitenanzahl | 160 |
Format | |
Größe | 31.70 MB |
- Geodäsie
- Computer Vision
- 3D-Rekonstruktion
Zusammenfassung
I. Einleitung
Die Wahrscheinliche Pose-Schätzung und die 3D-Rekonstruktion von Fahrzeugen aus Stereo-Bildern stellen bedeutende Herausforderungen im Bereich der Computer Vision und Photogrammetrie dar. Diese Dissertation behandelt die Notwendigkeit, 3D-Objekte aus 2D-Bildern zu rekonstruieren, was für Anwendungen wie mobile Robotik und autonomes Fahren von zentraler Bedeutung ist. Die Arbeit zeigt, dass die Integration von a priori Wissen über Objekte in den Rekonstruktionsprozess entscheidend ist. Ein 3D-Modell wird erstellt und an die 2D-Bilddaten angepasst, um die Genauigkeit der Rekonstruktion zu verbessern. Die Dissertation identifiziert jedoch auch die Einschränkungen bestehender Ansätze, die oft an unzureichenden Formprioren und der Unzulänglichkeit der Bildbeobachtungen leiden. Ziel ist es, wertvolle Beobachtungen aus den Bildern abzuleiten und zu demonstrieren, wie eine verbesserte Formrepräsentation und die Berücksichtigung verschiedener Beobachtungstypen die 3D-Rekonstruktion optimieren können.
II. Methodik
Die Dissertation präsentiert drei wesentliche Beiträge zur 3D-Rekonstruktion von Fahrzeugen aus Stereobildern. Zunächst wird ein differenziertes Fahrzeugmodell eingeführt, das eine Vorhersage des Fahrzeugtyps nutzt, um die Form des Fahrzeugs besser zu regulieren. Dies ermöglicht eine präzisere Anpassung des Modells an die Bilddaten. Zweitens wird ein Convolutional Neural Network (CNN) entwickelt, das Beobachtungen aus Bildern extrahiert. Das CNN leitet Vorhersagen zur Fahrzeugorientierung und -typ ab, die als a priori Informationen in die Modellanpassung einfließen. Darüber hinaus extrahiert das CNN wichtige Merkmale und Drahtgitterstrukturen, die für die Modellanpassung nützlich sind. Drittens wird ein vielseitiges probabilistisches Modell zur Pose-Schätzung und Rekonstruktion vorgestellt, das geeignete Parametrisierungen und Formulierungen für die Likelihood- und Prior-Terme umfasst. Diese Methodik ermöglicht eine umfassende Berücksichtigung der abgeleiteten Beobachtungen und priorisierten Informationen.
III. Ergebnisse und Diskussion
Die Ergebnisse der Dissertation zeigen, dass die vorgeschlagene Methode in der Lage ist, Fahrzeugpose-Schätzungen mit einer mittleren Fehlerquote von bis zu 27 cm in der Position und 1,7° in der Orientierung zu liefern. Um die Leistungsfähigkeit der Methode zu evaluieren, wurden umfangreiche Experimente mit zwei herausfordernden Datensätzen durchgeführt: dem öffentlich verfügbaren KITTI-Benchmark und dem ICSENS-Datensatz, der im Rahmen dieser Dissertation erstellt wurde. Die Ergebnisse belegen den Nutzen der entwickelten Formprioren und der einzelnen Komponenten des probabilistischen Modells. Ein Vergleich mit aktuellen Methoden zur Pose-Schätzung zeigt, dass der vorgeschlagene Ansatz gleichwertige oder bessere Ergebnisse liefert. Diese Erkenntnisse bestätigen die Eignung des entwickelten Modells und des Inferenzverfahrens für praktische Anwendungen in der Computer Vision.
IV. Fazit und Ausblick
Die Dissertation zur Wahrscheinlichen Pose-Schätzung und 3D-Rekonstruktion von Fahrzeugen aus Stereo-Bildern bietet wertvolle Einblicke in die Herausforderungen und Lösungen im Bereich der Computer Vision. Die entwickelten Methoden und Modelle haben das Potenzial, die Genauigkeit und Effizienz der 3D-Rekonstruktion erheblich zu verbessern. Zukünftige Forschungen könnten sich darauf konzentrieren, die Ansätze weiter zu verfeinern und neue Techniken zu integrieren, um die Robustheit und Anwendbarkeit in realen Szenarien zu erhöhen. Die Ergebnisse dieser Arbeit sind nicht nur für die akademische Gemeinschaft von Bedeutung, sondern auch für die Industrie, insbesondere in Bereichen wie der automatisierten Fahrzeugtechnologie und der intelligenten Verkehrssysteme.
Dokumentreferenz
- Probabilistic Pose Estimation and 3D Reconstruction of Vehicles from Stereo Images (Maximilian Alexander Coenen)
- Wissenschaftliche Arbeiten der Fachrichtung Geodäsie und Geoinformatik der Universität Hannover
- KITTI benchmark
- ICSENS data set
- TU Berlin (Prof. Dr.-Ing. Olaf Hellwich)