Automatic Verification of Road Databases using multiple Road Models

Automatische StraßenDB-Verifikation

Dokumentinformationen

Autor

Marcel Ziems

instructor/editor Prof. Dr.-Ing. Christian Heipke
Schule

Gottfried Wilhelm Leibniz Universität Hannover

Fachrichtung Bauingenieurwesen und Geodäsie
Dokumenttyp Dissertation
Ort München
Sprache German
Format | PDF
Größe 13.37 MB

Zusammenfassung

I.Modellierung und Kombination von Straßenobjekt Erkennungsmethoden

Die Dissertation untersucht die automatische Verifikation von Straßendatenbanken mithilfe von Fernerkundungsdaten. Hierbei werden verschiedene, teilweise komplementäre Straßen-Erkennungsmodelle (z.B. texturbasierte Modelle, Modelle basierend auf Kantenausrichtungen) vorgestellt. Ein zentraler Aspekt ist die Kombination dieser Modelle unter Berücksichtigung von Modellunsicherheiten. Die Dempster-Shafer-Theorie (DST) wird als probabilistischer Ansatz zur Fusion der unsicheren Informationen aus den einzelnen Modulen eingesetzt. Ein wesentlicher Beitrag der Arbeit ist die Entwicklung eines neuen Ansatzes zur Bestimmung der Modellanwendbarkeit, der auf einer Bewertung der impliziten Modellannahmen basiert. Die Ergebnisse der einzelnen Module werden in einem neuen Zustandsraum (richtig, falsch, unbekannt) kombiniert und klassifiziert, bevor eine manuelle Nachbearbeitung erfolgt.

1. Modularer Ansatz zur Straßenobjekt Erkennung

Der Kern der Arbeit liegt in der Entwicklung eines modularen Ansatzes zur Straßenobjekt-Erkennung und -Verifikation. Jedes Modul liefert zwei Wahrscheinlichkeitsverteilungen: eine für den Zustand des Datenbankobjekts (richtig/falsch), basierend auf bestehenden Verfahren, und eine für die Anwendbarkeit des jeweiligen Modells (anwendbar/nicht anwendbar). Letzteres ist ein wichtiger, originärer Beitrag dieser Arbeit. Die Anwendbarkeit wird anhand der impliziten Modellannahmen bewertet; nur bei Erfüllung aller Annahmen (z.B. Vorhandensein spezifischer Straßentypen, Kontextbereiche, geographischer Regionen, Sichtbarkeit von Merkmalen oder Verfügbarkeit repräsentativer Trainingsdaten bei statistischen Modellen) gilt das Modell als anwendbar. Die resultierenden Wahrscheinlichkeiten aus den beiden Zustandsräumen (richtig/falsch und anwendbar/nicht anwendbar) werden gemäß der Dempster-Shafer-Theorie in einen neuen Zustandsraum (richtig, falsch, unbekannt) abgebildet. Die Kombination und Klassifizierung erfolgen in diesem neuen Raum, dessen Ergebnis als Grundlage für die manuelle Nachbearbeitung dient. Dieser Ansatz ermöglicht die Integration verschiedener, komplementärer Methoden zur Straßenobjekt-Erkennung für eine verbesserte Genauigkeit der Datenverifikation.

2. Klassifikationsmethoden Kantenausrichtung Textur und Kombinationsansätze

Die Dissertation beschreibt verschiedene Ansätze zur Straßenobjekt-Erkennung. Methoden basierend auf Kantenausrichtungen modellieren Straßen als Regionen mit geringer Kantenhäufigkeit und – falls vorhanden – paralleler Kantenrichtung (z.B. die 'Acuspunctur'-Methode von Youn et al. [2008]). Texturbasierte Modelle nutzen charakteristische Texturen von Straßen in Bildern (z.B. Quam [1978], Haverkamp [2002], Mena & Malpica [2005]). Die Arbeit untersucht verschiedene Strategien zur Kombination dieser Methoden: ein 'Either-Or'-Konzept wählt das beste Modell für eine gegebene Situation basierend auf Konfidenzmaßen. Sequentielle Kombinationen komplexer Modelle mit komplementären Eigenschaften verwenden Fuzzy-Membership-Werte zur Steuerung der Interaktionen. Der Ansatz unabhängiger Methoden, bei dem jedes Modell auf eine spezifische Straßeneigenschaft fokussiert, verwendet ein Fusionsverfahren mit gleichrangigen Methoden (z.B. Hinz & Baumgartner [2003], Gerke & Heipke [2008]). Maschinelle Lernverfahren wie neuronale Netze (Mnih & Hinton [2010]) oder SVM-Klassifikatoren (Das et al. [2011]) werden ebenfalls zur Kombination unabhängiger Methoden eingesetzt. Der Fokus liegt dabei auf der optimalen Fusion der Ergebnisse unter Berücksichtigung der jeweiligen Stärken und Schwächen.

3. Herausforderungen bestehender Ansätze und Lösungsansätze

Die Analyse bestehender Ansätze zur Straßenobjekt-Erkennung zeigt Schwächen, insbesondere bei kleinen Testdatensätzen (<200 Objekte), niedrigen Detektionsraten (75-85%), Vernachlässigung der Topologie von Kreuzungen und ästhetisch unbefriedigenden, automatisch extrahierten Geometrien. Die Dissertation adressiert zwei Hauptprobleme: die Kombination unabhängiger, unsicherer Informationen für eine optimale Klassifizierung und die Bestimmung der benötigten Unsicherheiten. Supervised Learning Methoden sind abhängig von repräsentativen Trainingsdaten. Fehlen diese, sind die Ergebnisse nicht interpretierbar. Die Arbeit präsentiert einen probabilistischen Ansatz basierend auf der Dempster-Shafer Theorie zur Lösung des ersten Problems. Für das zweite Problem wird die Support Vector Data Description (SVDD) zur Definition einer Metrik für den Abstand im Merkmalsraum verwendet. Diese Metrik dient zur Abschätzung der Wahrscheinlichkeit für interpretierbare bzw. nicht interpretierbare Ergebnisse eines SVM-Klassifikators. Die Herausforderung besteht darin, die Unsicherheiten der einzelnen Modelle präzise zu erfassen und in der kombinierten Analyse zu berücksichtigen, um zuverlässige Ergebnisse für die Straßenkartenverifikation zu erzielen.

II.Unsicherheitsmodellierung und Support Vector Data Description SVDD

Ein weiterer Schwerpunkt liegt auf der quantitativen Bestimmung der Modellunsicherheiten. Hierfür wird die Support Vector Data Description (SVDD) eingesetzt, ein One-Class-Klassifikator, der Ausreißer im Merkmalsraum identifiziert. Der Abstand eines Testbeispiels zu den Trainingsdaten dient als Maß für die Interpretierbarkeit des Klassifikationsergebnisses. Die SVDD liefert die Grundlage für eine Metrik, die in der Dissertation detailliert beschrieben wird, um die Unsicherheit der Klassifizierung von Straßenobjekten zu quantifizieren. Dies ermöglicht eine fundiertere Kombination der Ergebnisse verschiedener Straßen-Erkennungsalgorithmen innerhalb des Datenfusionsprozesses.

1. Quantifizierung von Modellunsicherheiten

Ein zentrales Thema der Arbeit ist die Quantifizierung der Unsicherheit, die mit den verwendeten Straßen-Erkennungsmodellen einhergeht. Bei überwachten Lernmethoden hängt die Zuverlässigkeit der Ergebnisse stark von der Repräsentativität der Trainingsdaten ab. Stimmt die Verteilung der Trainingsdaten nicht mit den Eigenschaften der zu klassifizierenden Testdaten überein, so sind die Ergebnisse des Klassifikators im Kontext des Hauptproblems der Straßenklassifizierung nicht interpretierbar. Die Dissertation adressiert dieses Problem, indem sie die Wahrscheinlichkeit für interpretierbare und nicht interpretierbare Ausgaben eines SVM-Klassifikators definiert, basierend auf dem Abstand im Merkmalsraum zwischen Testbeispiel und Trainingsdaten. Diese Unsicherheitsmodellierung ist essentiell für eine zuverlässige Kombination der Ergebnisse verschiedener Methoden, da sie die Konfidenz in die einzelnen Klassifikationsergebnisse quantifiziert und in den Fusionsprozess einbezieht. Die genaue Bestimmung und Berücksichtigung dieser Unsicherheiten ist entscheidend für die Zuverlässigkeit des gesamten Systems zur Straßenverifikation.

2. Support Vector Data Description SVDD zur Unsicherheitsabschätzung

Zur Bestimmung der Modellunsicherheit wird die Support Vector Data Description (SVDD) als One-Class-Klassifikator eingesetzt. SVDD trennt Inlier von Outlier anhand von Trainingsdaten nur der Inlier-Klasse. Testbeispiele, die weit außerhalb der durch die SVDD definierten Hypersphäre liegen (wie z.B. eine Baumreihe, die fälschlicherweise als Straße klassifiziert werden könnte), werden als Ausreißer identifiziert. Der Abstand eines Testbeispiels zur SVDD-Hypersphäre dient als Basis für eine Metrik zur Quantifizierung der Modellunsicherheit. Die SVDD-Hypersphäre an sich ist nicht direkt die Metrik, sondern dient als Grundlage für weitere Untersuchungen von Metriken im Kernelspace. Die Arbeit beschreibt die theoretischen und praktischen Grundlagen der SVDD und wie diese zur Bestimmung der Wahrscheinlichkeit für korrekte und inkorrekte Klassifikationen verwendet wird. Die genaue Definition und Anwendung dieser Metrik ist kritisch für die Bewertung der Zuverlässigkeit der einzelnen Straßen-Erkennungsmodule und somit für die Gesamtgenauigkeit der Straßenverifikations-Methode.

III.Verifikationsmodule und deren Kombination

Die Dissertation präsentiert zehn unabhängige Verifikationsmodule, die jeweils auf spezifische Eigenschaften von Straßen im Bild fokussieren. Diese Module basieren auf etablierten Straßen-Detektionsansätzen, werden jedoch für die Verifikationsaufgabe adaptiert und erweitert. Beispiele beinhalten die Verwendung von Acuspunctur-Methoden für urbane Gebiete und texturbasierte Ansätze für ländliche Gebiete. Die Integration von a priori-Wissen aus der Datenbank und die Berücksichtigung der Schwächen einzelner Module verbessern die Gesamtleistung. Die Kombination der Ergebnisse erfolgt mittels der Dempster-Shafer Theorie, wobei der Zustandsraum explizit den Zustand „unbekannt“ beinhaltet. Die Analyse und mathematische Definition der Modellunsicherheiten für verschiedene Straßen-Detektionsansätze stellt einen weiteren wichtigen Beitrag der Arbeit dar.

1. Beschreibung der Verifikationsmodule

Die vorgestellte Methodik zur Straßenverifikation basiert auf zehn unabhängigen Modulen. Jedes Modul konzentriert sich auf eine spezifische Straßeneigenschaft und verwendet daher ein vergleichsweise einfaches Modell. Diese Einfachheit hat zur Folge, dass ein einzelnes Modul nicht jede denkbare Situation (alle möglichen Erscheinungsformen korrekter und inkorrekter Straßenhypothesen) bewältigen kann. Die einzelnen Module berücksichtigen jedoch unterschiedliche Straßeneigenschaften. Beispielsweise sind die 'Pan-' und 'NDVI'-Liniendetektionsmodule für offene Landschaften und ländliche Gebiete konzipiert, das 'Acuspunctur'-Modul für städtische Gebiete mit Einzelhäusern und das 'NDSM'-Liniendetektionsmodul für dicht bebaute Gebiete. Einige Module sind so konzipiert, dass sie in Situationen funktionieren, in denen andere Module versagen. Die Kombination dieser spezialisierten Module ermöglicht eine umfassendere und robustere Straßenverifikation im Vergleich zu einzelnen, komplexeren Methoden.

2. Kombination der Verifikationsmodule mittels Dempster Shafer Theorie

Die Ergebnisse der zehn unabhängigen Verifikationsmodule werden mittels der Dempster-Shafer-Theorie (DST) kombiniert. Dies ist ein probabilistischer Ansatz, der die Unsicherheit der einzelnen Module berücksichtigt und eine fundierte Entscheidung über den Zustand der Straßenobjekte ermöglicht. Ein entscheidender Vorteil der DST ist die explizite Berücksichtigung des Zustands 'unbekannt', der die Unsicherheit des Systems direkt ausdrückt. Im Gegensatz zu anderen Ansätzen, die die DST zur Fusion von Informationen auf niedrigerer Ebene verwenden (z.B. Gerke [2005], Poulain et al. [2010]), wird hier die DST auf der Entscheidungsebene angewendet, was einen neuartigen Beitrag darstellt. Die Kombination der Ergebnisse der einzelnen Module in einem gemeinsamen Entscheidungsraum führt zu einer robusteren und genaueren Klassifizierung der Straßenobjekte als dies mit einzelnen Modulen möglich wäre.

3. Beiträge der Arbeit im Kontext der Verifikationsmodule

Die Arbeit leistet mehrere Beiträge im Kontext der Verifikationsmodule. Erstens wird gezeigt, wie etablierte Straßen-Detektionsstrategien effektiv in Strategien für die Straßenverifikation übertragen werden können. Zweitens werden einige der bestehenden Strategien erweitert, um sie für den Gesamtvorgehensweise effektiver zu machen, z.B. durch Integration von a priori-Wissen aus der Datenbank oder Fokussierung auf die Schwächen anderer Module. Drittens werden die Modell-Unsicherheiten für mehrere state-of-the-art Straßen-Detektionsansätze analysiert und mathematisch definiert. Diese detaillierte Analyse und Definition der Modellunsicherheiten ist ein wichtiger Beitrag, um die Zuverlässigkeit und Genauigkeit des gesamten Systems zur Straßenverifikation zu verbessern und die Ergebnisse der verschiedenen Module auf eine fundierte Weise zu kombinieren. Die Modularität des Systems erlaubt zudem eine flexible Anpassung an unterschiedliche Datensätze und Anwendungsszenarien.

IV.Evaluierung und Ergebnisse

Die entwickelte Methodik wird anhand verschiedener Datensätze evaluiert, darunter der MGCP-Algiers Datensatz (IKONOS Bild mit 1 m GSD, 1378 befestigte und 909 unbefestigte Straßen, Gesamtlänge 750 km, Fläche 200 km²), der NGI-Zeebrugge Datensatz (620 km Straßen, Fläche 134 km²) und der EuroSDR-Ikonos Datensatz. Die Ergebnisse zeigen eine hohe Genauigkeit der automatischen Straßenverifikation. Die Analyse der Ergebnisse beleuchtet die Stärken und Schwächen der einzelnen Module und der Gesamtmethodik. Die verschiedenen Szenarien (z.B. städtische vs. ländliche Gebiete, unterschiedliche Bildauflösungen) ermöglichen eine umfassende Bewertung der Robustheit des vorgeschlagenen Ansatzes. Es werden Kennzahlen wie Vollständigkeit und Genauigkeit präsentiert und diskutiert, um die Leistungsfähigkeit im Vergleich zu bestehenden Ansätzen zu bewerten. Die erzielte Automatisierungsrate wird ebenfalls detailliert untersucht und in Bezug zu unterschiedlichen Arbeitsaufwänden gesetzt.

1. Evaluierung mit verschiedenen Datensätzen

Die Evaluierung der entwickelten Methodik zur Straßenverifikation erfolgte anhand verschiedener Datensätze. Genannt werden der MGCP-Algiers Datensatz (IKONOS Bild, 1 m GSD, 1378 befestigte und 909 unbefestigte Straßen, Gesamtlänge 750 km, Fläche 200 km²), der NGI-Zeebrugge Datensatz (620 km Straßen, Fläche 134 km²) und der EuroSDR-Ikonos Datensatz. Der MGCP-Algiers Datensatz umfasste eine manuelle Qualitätsprüfung, die 33 fehlerhafte Straßenobjekte (Gesamtlänge 13 km) identifizierte, die als Referenz für die Bewertung der automatisierten Methode dienten. Der NGI-Zeebrugge Datensatz basierte auf einem Datenbank-Extrakt aus dem Jahr 1997, während die Bilder 2011 aufgenommen wurden; dies ermöglichte die Erkennung von Veränderungen im Straßennetz. Eine interaktive Qualitätskontrolle identifizierte 577 fehlerhafte von 5259 korrekten Straßenobjekten. Die Auswahl unterschiedlicher Datensätze mit verschiedenen Eigenschaften (urbane vs. ländliche Gebiete, unterschiedliche Bildauflösungen) erlaubt eine umfassende Beurteilung der Robustheit und Generalisierbarkeit des entwickelten Ansatzes.

2. Analyse der Ergebnisse und Kennzahlen

Die Ergebnisse der Evaluation werden anhand verschiedener Kennzahlen analysiert. Der MGCP-Algiers Datensatz zeigte, dass die meisten Straßenhypothesen korrekt klassifiziert wurden, während nur wenige als 'unbekannt' oder 'inkorrekt' eingestuft wurden. Im Datensatz GSI-Uraga erzielte die 'Acuspunctur'-Methode die besten Ergebnisse (ca. 58% der Straßen korrekt erklärt), gefolgt vom Farb-Klassifikationsmodul (42%). Die Analyse der Ergebnisse hebt die Stärken und Schwächen der einzelnen Module hervor, z.B. die Eignung des SSH-Moduls für niedrig aufgelöste Bilder oder die Fähigkeit des Farb-Klassifikationsmoduls, Schatteneffekte zu handhaben. Der Anteil der als 'unbekannt' klassifizierten Straßenhypothesen nimmt mit steigender Anzahl der verwendeten Module ab (31% für MGCP-Algiers mit sechs Modulen, 16% für NGI-Zeebrugge mit zehn Modulen). Ein hoher Anteil an 'unbekannten' Klassifikationen ist häufig bei fehlerhaften Straßenhypothesen zu beobachten, was darauf hindeutet, dass die verwendeten Modelle Straßen besser repräsentieren als die auftretenden Fehler in der Datenbank.

3. Diskussion der Ergebnisse und Automatisierungsgrad

Die Ergebnisse zeigen eine hohe Genauigkeit der Straßenverifikation mit einem Automatisierungsgrad von 66-74% im konservativen Szenario und 91-100% im Szenario mit geringerem Aufwand. Ein Vergleich mit dem Ansatz von Gerke & Heipke [2008] zeigt eine ähnliche Größenordnung der Ergebnisse, wobei der neue Ansatz durch seine allgemeine Anwendbarkeit (nicht nur auf ländliche Gebiete beschränkt) einen Vorteil aufweist. Die Diskussion der Ergebnisse umfasst die Analyse von Fehlklassifikationen, z.B. die Zuordnung von Brücken zu Gebäuden oder die Problematik zu kurzer Straßenabschnitte. Die Analyse des Zustands 'unbekannt' zeigt, dass dieser Zustand oft auf Situationen hinweist, die von den verwendeten Modellen nicht gut abgedeckt werden (z.B. bewaldete Gebiete, Strandpromenaden, ungewöhnliche Straßenstrukturen). Die flexibilität des Ansatzes bezüglich unterschiedlicher Anforderungen wird durch die Definition verschiedener interaktiver Einstellungen demonstriert, die unterschiedliche Automatisierungsgrade ermöglichen. Die Arbeit zeigt insgesamt eine hohe Leistungsfähigkeit des entwickelten Systems zur automatisierten Straßenverifikation.