Finding spectral features for the early identication of biotic stress in plants

Pflanzenstress: Spektrale Erkennung

Dokumentinformationen

Autor

Till Rumpf

instructor Prof. Dr. Rer. Nat. Lutz Plümer
Schule

Rheinische Friedrich-Wilhelms-Universität Bonn

Fachrichtung Landwirtschaftliche Fakultät (Agricultural Faculty)
Dokumenttyp Inaugural-Dissertation (Doctoral Dissertation)
Ort München
Sprache German
Format | PDF
Größe 7.93 MB

Zusammenfassung

I.Früherkennung von Pflanzenkrankheiten mittels Hyperspektraler Bildgebung und Support Vektor Maschinen SVMs

Diese Forschungsarbeit konzentriert sich auf die frühe Erkennung von Pflanzenkrankheiten, insbesondere an Zuckerrüben ( Cercospora beticola, Erysiphe betae, Uromyces betae) und Weizen ( Puccinia triticina), mittels hyperspektraler Datenanalyse. Dabei werden spektrale Vegetationsindizes (VIs) und Support Vektor Maschinen (SVMs) als leistungsstarke Machine-Learning-Methode eingesetzt. Die Studie zeigt, dass die Kombination verschiedener VIs eine deutlich höhere Genauigkeit bei der Unterscheidung zwischen gesunden und kranken Pflanzen ermöglicht als die Verwendung einzelner Indizes wie dem NDVI. Die Auswertung hyperspektraler Daten erlaubt eine präsymptomatische Erkennung von Krankheiten, bevor sichtbare Symptome auftreten. Die Auswahl relevanter Merkmale (Feature Selection) mittels Algorithmen wie RELIEF-F spielt eine entscheidende Rolle für die Klassifikationsgenauigkeit der SVMs.

1. Spektrale Vegetationsindizes VIs und ihre Grenzen bei der Krankheitsdiagnose

Der Abschnitt behandelt die Anwendung von spektralen Vegetationsindizes (VIs) zur Erkennung von Pflanzenkrankheiten. Lineare Modelle sind zwar einfach, versagen aber oft aufgrund von Nichtlinearitäten in den spektralen Daten. Nichtlineare Wellenlängenkombinationen wurden entwickelt, um diese Problematik zu umgehen und Korrelationen zwischen spektralen Eigenschaften und Pflanzenparametern mittels linearer Regression zu detektieren (Carter und Knapp, 2001; Delalieux et al., 2009). Seit fast 40 Jahren werden solche task-spezifischen Kombinationen als VIs publiziert. Viele Forschungsgruppen analysierten spektrale Daten mit VIs, um quantitative Korrelationen zu biophysikalischen und biochemischen Merkmalen zu finden (Gitelson et al., 2002). VIs eignen sich zur Unterscheidung gesunder und kranker Pflanzen (Delalieux et al., 2009; Steddom et al., 2005). Mahlein et al. (2010) zeigten, dass die Korrelation von VIs mit Pflanzenkrankheiten von der Art und dem Schweregrad der Krankheit abhängt. Ein einzelner VI reicht jedoch meist nicht zur Identifizierung und Unterscheidung verschiedener Krankheiten aus. Die präsymptomatische Identifizierung von Pflanzenkrankheiten war bisher nicht möglich. Dieser Abschnitt legt den Grundstein für die Notwendigkeit komplexerer Methoden zur Pflanzenkrankheiten-Diagnostik.

2. Generative vs. Diskriminative Modelle im Pflanzenschutz

Es wird ein Vergleich zwischen generativen und diskriminativen Modellen angestellt. Generative Modelle sind aufwendiger, da sie die gemeinsame Verteilung von Datenpunkten (x) und Klassen (y) erfordern. Bei hochdimensionalen Daten (x) ist eine große Datenmenge für eine genaue Wahrscheinlichkeitsbestimmung nötig. Ein Vorteil ist die qualitative Aussage über neue Beobachtungen basierend auf der marginalen Dichte p(x). Diskriminative Modelle benötigen hingegen nur die posterior Wahrscheinlichkeiten und sind somit schneller, robuster und genauer, besonders wenn nur begrenzte Informationen über das zugrunde liegende Datenmodell vorhanden sind – wie oft im Präzisionspflanzenschutz der Fall (McCallum et al., 2000). Dieser Abschnitt unterstreicht die Eignung diskriminativer Modelle für den Präzisionspflanzenschutz, wo oft nur beschränkte Daten verfügbar sind und eine schnelle, robuste Analyse erforderlich ist.

3. Machine Learning im Präzisionspflanzenschutz Vorläufer und Herausforderungen

Der Abschnitt beschreibt frühe Anwendungen von Machine-Learning-Methoden im Pflanzenschutz. De Wolf und Francl (2000) nutzten neuronale Netze zur Vorhersage von Infektionszeiträumen bei Weizen. Moshou et al. (2004) detektierten automatisch Gelbrost an Weizen basierend auf Reflexionsmessungen. Wang et al. (2008) setzten künstliche neuronale Netze (ANNs) zur Vorhersage von Phytophthora infestans-Infektionen an Tomaten ein, während Wu et al. (2008) einen frühen Erkennung von Botrytis cinerea an Auberginenblättern mittels neuronaler Netze und Principal Component Analysis (PCA) demonstrierten. Burks et al. (2005) bewerteten verschiedene neuronale Netze für die Unkrautunterscheidung. Die biologische Variabilität von Pflanzen stellt eine große Herausforderung für die frühzeitige Erkennung von biotischem Stress dar. Machine-Learning-Methoden befinden sich im Präzisionspflanzenschutz noch in einem frühen Entwicklungsstadium (Mucherino et al., 2009; Huang et al., 2010). Dieser Abschnitt liefert einen Überblick über den bisherigen Stand der Technik und verdeutlicht die Herausforderungen, die mit der Anwendung von Machine-Learning-Methoden im Pflanzenschutz verbunden sind.

4. Support Vector Machines SVMs Vorteile und Eigenschaften

Dieser Abschnitt konzentriert sich auf die Eigenschaften von Support Vector Machines (SVMs). SVMs zeichnen sich durch eine hervorragende Generalisierungsfähigkeit aus, indem sie die Marge um die Hyperebene maximieren (Boser, 1992; Vapnik, 2000). Anstatt die empirischen Modellfehler zu minimieren (empirische Risikominimierung), minimiert die strukturelle Risikominimierung (SRM) den Fehler bei der Vorhersage von unbekannten Testdaten (Vapnik-Chervonenkis-Theorie). SRM entspricht dem Prinzip der Ockhams Rasiermesser und bestraft Overfitting. SVMs sind besonders bei kleinen Datensätzen vorteilhaft, da sie nur die Datenpunkte nahe der Entscheidungsgrenze (Support Vectors) zur Modellbildung verwenden. Dieser Abschnitt betont die Vorteile von SVMs für die Analyse von Datenmengen mit vielen Merkmalen und wenigen Stichproben ('large-p, small-n' Problem), was typisch für hyperspektrale Daten ist.

5. Frühe Erkennung biotischen Stresses mit SVMs Ansatz und Herausforderungen

Hier wird ein Ansatz vorgestellt, der moderne Sensortechniken und fortschrittliche Machine-Learning-Methoden kombiniert. Die frühzeitige Erkennung und Klassifizierung von Pflanzenkrankheiten und Unkräutern mittels nicht-invasiver Beobachtungen und nicht-linearer SVMs wird diskutiert. Die präsymptomatische Identifizierung von Pflanzenkrankheiten basierend auf spektralen Vegetationsindizes (VIs) wird erreicht. Es wird die Frage nach dem optimalen Verhältnis zwischen Klassifikationsgenauigkeit und Modellkomplexität behandelt. Eine sorgfältige Auswahl relevanter Merkmale ist entscheidend. Die Modellierung von Signalrauschen durch eine analytische Beschreibung des Spektrums verbessert die frühzeitige Erkennung. Eine robuste Anpassung von Fluoreszenzspektren wird durch eine stückweise Anpassung mittels Polynomen niedriger Ordnung demonstriert. Dieser Abschnitt beschreibt die praktische Anwendung der beschriebenen Methoden und die damit verbundenen Herausforderungen.

II.Optimierung der Merkmalsauswahl für die Pflanzenkrankheiten Klassifizierung

Ein wichtiger Aspekt der Forschung ist die Optimierung der Merkmalsauswahl. Es wird untersucht, welche spektralen Vegetationsindizes (VIs) für die Erkennung spezifischer Pflanzenkrankheiten am besten geeignet sind. Hierbei kommen Verfahren wie der RELIEF-F Algorithmus und das Minimum Redundancy Maximum Relevance (mRMR) Kriterium zum Einsatz, um redundante Informationen zu reduzieren und die Relevanz der Merkmale zu maximieren. Die Ergebnisse zeigen, dass je nach Krankheit unterschiedliche Mengen und Kombinationen von VIs für eine optimale Klassifizierung notwendig sind. Die Genauigkeit der Klassifizierung wird durch die gezielte Merkmalsauswahl deutlich gesteigert.

1. Herausforderungen bei der Merkmalsauswahl Redundanz und Relevanz

Die Auswahl der relevantesten Merkmale (Feature Selection) aus hyperspektralen Daten stellt eine zentrale Herausforderung dar. Die hohe Dimensionalität der Daten, mit vielen stark korrelierten Wellenlängen, führt zu Redundanz und erschwert die Identifizierung der für die Krankheitsklassifizierung wirklich wichtigen Informationen. Ein einzelner spektraler Vegetationsindex (VI) reicht oft nicht aus, um verschiedene Pflanzenkrankheiten zu unterscheiden, da die Korrelation zwischen VIs und Krankheitsschweregrad von der Art der Krankheit abhängt (Mahlein et al., 2010). Das Ziel besteht darin, die optimale Kombination von VIs zu finden, um eine hohe Klassifikationsgenauigkeit bei minimaler Komplexität zu erreichen. Dies erfordert Methoden zur Reduktion der Dimensionalität und zur Identifizierung nicht-redundanter Merkmale, die die entscheidenden Informationen für die Unterscheidung zwischen gesunden und kranken Pflanzen enthalten. Die Problematik der teilweise redundanten Merkmale wird besonders im Kontext von Zuckerrüben-Blättern (Cercospora-Blattflecken, Zuckerrübenrost und Echter Mehltau) deutlich, wo die Überlappung der NDVI-Werte zwischen gesunden und kranken Blättern eine zuverlässige Klassifizierung erschwert.

2. Der RELIEF F Algorithmus zur Merkmalsbewertung

Um die Relevanz von Merkmalen zu bewerten und die Dimensionalität zu reduzieren, wird der RELIEF-F Algorithmus eingesetzt. Dieser Algorithmus ist unempfindlich gegenüber Rauschen und kann mit hoch korrelierten Merkmalen, wie sie bei benachbarten Wellenlängen auftreten, umgehen. RELIEF-F misst die Homogenität von Klassenlabels in der lokalen Nachbarschaft zufällig ausgewählter Stichproben. Der Algorithmus bewertet Merkmale danach, wie gut ihre Werte zwischen benachbarten Stichproben verschiedener Klassen unterscheiden. RELIEF-F ist robuster als der ursprüngliche RELIEF-Algorithmus, da er Nachbarschaften von k Elementen berücksichtigt (Kononenko, 1994). Für eine gegebene Stichprobe sucht RELIEF-F nach den k nächsten Nachbarn derselben Klasse ('hits') und den k nächsten Nachbarn verschiedener Klassen ('misses'). Die Merkmalsrelevanz wird durch die Summe der euklidischen Distanzen zwischen den nächsten 'hits' und 'misses' für alle Stichproben bestimmt. Dieser Algorithmus hilft, die relevantesten Wellenlängen oder Wellenlängenunterschiede für die Unterscheidung zwischen gesunden und kranken Pflanzen zu identifizieren.

3. Extraktion geeigneter Merkmale aus spektralen Signaturen

Die Extraktion geeigneter Merkmale aus den komplexen hyperspektralen Signaturen ist essenziell für die effiziente und genaue Klassifizierung. Fluoreszenzspektren weisen oft ein schlechtes Signal-Rausch-Verhältnis auf, was zusätzliche Glättungsverfahren erforderlich macht (Abbildung 3.5). Eine stückweise Approximation der gesamten Fluoreszenz-Kurve durch Polynome niedriger Ordnung wird eingesetzt, um das schlechte Signal-Rausch-Verhältnis zu kompensieren. Diese Methode berücksichtigt die gesamte Information der Kurve. Techniken, die das gesamte Spektrum berücksichtigen, versprechen neue Einblicke in frühe Stressreaktionen. Im Gegensatz dazu sind Klassifikatoren, die sich auf einzelne Wellenlängen stützen, anfälliger für Ausreißer und Rauschen, besonders wenn die Variationen in der Signatur subtil sind. Filter-basierte Merkmalsauswahlalgorithmen können einzelne Wellenlängen zurückgeben, bei denen die Trennung zwischen Klassen zufällig durch Rauschen und nicht durch biologisch plausible Effekte verursacht wird. Das Ziel ist also, robuste und aussagekräftige Merkmale zu extrahieren, die den Einfluss von Rauschen minimieren.

4. Strukturierter Merkmalsraum für sequentielle Klassifizierung

Bei der Unterscheidung verschiedener Unkrautarten mittels Formmerkmalen ergibt sich erneut das Problem der Merkmalsauswahl. Einige Formmerkmale sind wichtiger als andere. Die Formmerkmale wurden aus Differenzbildern zwischen nah-infraroten (IR, 720 nm) und roten Licht (R, 620-680 nm) abgeleitet und anschließend mit einem Grauwert-Schwellenwert gefiltert, um Rauschen zu reduzieren. Drei Arten von Formmerkmalen wurden berechnet: (i) regionenbasierte, (ii) konturenbasierte und (iii) skelettbasierte Merkmale (Jähne, 2001; Weis und Gerhards, 2007). Ein für die Trennung zweier Unkrautarten optimales Merkmal ist jedoch möglicherweise nicht geeignet, um zwischen zwei anderen Unkräutern zu unterscheiden. Die Relevanz von Merkmalen hängt von der jeweiligen Trennaufgabe ab. Eine sequentielle Klassifizierung mit spezifischen Merkmalen kann helfen, dieses Problem zu überwinden, anstatt den gleichen Merkmalssatz und SVM-Parameter wie bei herkömmlichen Multi-Class-SVMs zu verwenden. Dieser Abschnitt zeigt, dass die Optimierung der Merkmalsauswahl auch von der konkreten Aufgabenstellung (z.B. Unterscheidung verschiedener Unkrautarten) abhängt und eine Anpassung der Merkmalsauswahl an die jeweilige Aufgabe notwendig ist.

III.Anwendungsbereiche und zukünftige Perspektiven der präsymptomatischen Pflanzenkrankheiten Erkennung

Die entwickelten Methoden zur frühen Erkennung von Pflanzenkrankheiten mit Hilfe von hyperspektraler Bildgebung und SVMs bieten großes Potenzial für den Einsatz in der Präzisionslandwirtschaft. Dies ermöglicht eine gezieltere und effizientere Anwendung von Pflanzenschutzmitteln, was sowohl wirtschaftliche als auch ökologische Vorteile mit sich bringt. Zukünftige Forschungsarbeiten konzentrieren sich auf die Übertragung der Ergebnisse auf Feldversuche unter realen Bedingungen, die Berücksichtigung weiterer Stressfaktoren und die Entwicklung robuster und kostengünstiger Sensoren für den praktischen Einsatz. Die Verwendung von spektralen Krankheitsindizes (SDIs) ermöglicht die Reduktion der Datendimensionalität und effizientere Datenverarbeitung.

1. Potenzial für den Präzisionspflanzenschutz

Die präsymptomatische Erkennung von Pflanzenkrankheiten mittels hyperspektraler Bildgebung und Support Vector Machines (SVMs) bietet erhebliches Potenzial für den Präzisionspflanzenschutz. Die frühzeitige Identifizierung von Krankheiten ermöglicht eine gezieltere und effizientere Anwendung von Pflanzenschutzmitteln, was zu einer Reduktion der Kosten und der Umweltbelastung führt. Die im Rahmen der Studie erzielten Ergebnisse zeigen eine hohe Genauigkeit bei der Unterscheidung zwischen gesunden und erkrankten Pflanzen, selbst bevor sichtbare Symptome auftreten. Dies ermöglicht ein optimiertes und ressourcenschonendes Schädlingsmanagement. Die Methode wurde erfolgreich an Zuckerrüben (mit den Pathogenen Cercospora beticola, Uromyces betae und Erysiphe betae) getestet und zeigt eine hohe Übertragbarkeit auf andere Pflanzen-Pathogen-Systeme. Die Entwicklung kostengünstiger und benutzerfreundlicher Sensoren auf Basis der gewonnenen Erkenntnisse wird als nächste Stufe der praktischen Anwendung gesehen.

2. Herausforderungen bei der Übertragung auf den Feldeinsatz

Die Übertragung der im Labor unter kontrollierten Bedingungen erzielten Ergebnisse auf den Feldeinsatz stellt eine wichtige Herausforderung dar. Im Feld überlagern verschiedene Stressfaktoren mit unkontrollierten Umweltbedingungen und der biologischen Variabilität zwischen Pflanzen und Sorten die krankheitsspezifischen Informationen in den Sensordaten. Um diese Herausforderungen zu meistern, wird der Einsatz von hyperspektralen Bildgebungssensoren vorgeschlagen, die eine pixelweise Messung der hyperspektralen Signatur ermöglichen. Dies erlaubt eine höhere räumliche Auflösung und die Integration zusätzlicher räumlicher Muster als Kontextwissen über die Nachbarschaft. Die Dekodierung der spektralen Signatur ist zwingend erforderlich, um die Haupteinflüsse zu modellieren und zwischen den Merkmalen von Stressfaktoren und Pflanzenmerkmalen zu unterscheiden. Die Robustheit der Methode unter realen Bedingungen muss durch Feldversuche weiter untersucht werden.

3. Zukünftige Forschungsrichtungen und Entwicklungsperspektiven

Zukünftige Forschungsarbeiten konzentrieren sich auf die Verbesserung der frühzeitigen Identifizierung und Unterscheidung von Pflanzenkrankheiten. Dies beinhaltet die Anwendung von Machine-Learning-Techniken auf die originalen hyperspektralen Daten, um die Genauigkeit weiter zu steigern. Ein Fokus liegt auf der Entwicklung robuster, kostengünstiger und benutzerfreundlicher Sensoren für den Online-Einsatz im Feld. Die entwickelte Methode basiert auf spektralen Vegetationsindizes (VIs), die mit physiologischen Parametern der Pflanzen korrelieren, und kann daher auf andere Pflanzen-Pathogen-Systeme übertragen werden. Die Entwicklung von spezifischen Krankheitsindizes (SDIs) kann die Sensitivität und Spezifität der Krankheitsdetektion verbessern, indem sie die Datendimensionalität reduziert und eine effizientere Datenanalyse ermöglicht. Die Übertragung der SDIs in die Praxis und die Testung der Anwendbarkeit für ein präzises, reproduzierbares und zeitsparendes Krankheitsmonitoring auf Kronen- und Feldebene mit verschiedenen Sensoren sind weitere wichtige Aufgaben.

IV.Unkrautbestimmung durch Bildanalyse und sequentielle Klassifizierung

Zusätzlich zur Erkennung von Pflanzenkrankheiten wird die automatische Unkrautbestimmung mittels Bildanalyse untersucht. Hierbei werden Formmerkmale (Shape Parameters) von Pflanzen in Bildern extrahiert und mit Support Vektor Maschinen (SVMs) klassifiziert. Aufgrund der hohen Ähnlichkeit zwischen verschiedenen Unkrautarten wird eine sequentielle Klassifizierung eingesetzt, die den Datensatz in hierarchisch strukturierte Gruppen unterteilt. Dieser Ansatz erhöht die Klassifikationsgenauigkeit, insbesondere für Unkräuter mit hoher wirtschaftlicher Relevanz wie Galium aparine und Cirsium arvense. Die Verwendung von RELIEF-F und SVM-Gewichtung optimiert die Merkmalsauswahl für jede Klassifizierungsebene.

1. Bildbasierte Unkrautdetektion Herausforderungen und Ansatz

Die Studie befasst sich mit der automatischen Erkennung verschiedener Unkrautarten mittels Bildverarbeitung und Machine Learning. Ziel ist die Entwicklung eines Systems zur standortspezifischen Unkrautbekämpfung, um den Herbizideinsatz zu reduzieren. Die Analyse von Bildserien verschiedener Messungen mit Pflanzenproben in unterschiedlichen Wachstumsstadien bildet die Grundlage. Die Unkrautarten unterscheiden sich in ihrem wirtschaftlichen Schaden und der notwendigen Herbizidbehandlung, daher ist eine genaue Unterscheidung der Arten unerlässlich. Ein herkömmlicher Multi-Klassifikationsansatz mit allen Unkrautarten und Kulturpflanzen scheitert jedoch aufgrund der hohen Ähnlichkeit der Merkmale verschiedener Unkrautarten, verstärkt durch unterschiedliche Wachstumsstadien. Besonders die Unterscheidung zwischen ähnlichen Dikotyledonen, z.B. Galium aparine und Veronica persica, stellt eine Herausforderung dar, da Galium aparine hohe wirtschaftliche Verluste verursacht. Daher wird ein sequentieller Klassifizierungsansatz entwickelt.

2. Sequentielle Klassifizierung mit Support Vector Machines SVMs

Um die Herausforderungen der Unkrautklassifizierung zu bewältigen, wird ein sequentieller Klassifizierungsansatz mit drei verschiedenen Support Vector Machine (SVM) Modellen verwendet. Im ersten Schritt werden Gruppen ähnlicher Pflanzenarten (Monokotyledonen, Dikotyledonen und Gerste) getrennt. Die Unterscheidung innerhalb der Dikotyledonen erweist sich als besonders schwierig. Daher werden diese in weiteren Schritten unterteilt. Für jeden Schritt werden unterschiedliche Merkmale als besonders wichtig identifiziert. Die Merkmalsgewichtung erfolgt mit dem RELIEF-F-Algorithmus und SVM-Gewichtung. Der Ansatz basiert auf einem Bildgebungssystem, das zwei Bilder mit unterschiedlichen Wellenlängen aufnimmt, um Pflanzen vom Hintergrund zu trennen. Die Pflanzen werden dann mit Bildverarbeitungsalgorithmen extrahiert und anhand ihrer Formmerkmale klassifiziert. Die Überlappung von Pflanzen führt zu komplexen Objekten, die schwer zu trennen sind. Diese werden gesondert klassifiziert. Die Analyse konzentriert sich auf frühe Wachstumsstadien, um Überlappungen zu minimieren. Die sequentielle Klassifizierung verbessert die Ergebnisse im Vergleich zu einem herkömmlichen Ansatz.

3. Merkmalsauswahl und Optimierung der Klassifikationsgenauigkeit

Die Auswahl der relevanten Merkmale spielt eine entscheidende Rolle für die Genauigkeit der Unkrautklassifizierung. Während die Unterschiede in den Formmerkmalen zwischen Kulturpflanzen und Unkraut relativ groß sind, zeigen die Merkmale der einzelnen Unkräuter eine hohe Ähnlichkeit. Daher werden für jeden Klassifizierungsschritt unterschiedliche Merkmale als am wichtigsten identifiziert. Die Merkmalsgewichtung erfolgt mit dem RELIEF-F-Algorithmus (Kononenko et al., 1994) und SVM-Gewichtung (Guyon et al., 2002). Je nach Klassifizierungsaufgabe werden lineare und nicht-lineare Support Vector Machines (SVMs) eingesetzt. Die sequentielle Klassifizierung ermöglicht die Unterscheidung von Unkrautarten und -gruppen für eine standortspezifische Unkrautbekämpfung. Dies erlaubt nicht nur die Unterscheidung zwischen Kulturpflanzen und Unkräutern, sondern auch eine Klassifizierung innerhalb der Unkräuter in Monokotyledonen und Dikotyledonen. Insbesondere Galium aparine, das hohe wirtschaftliche Verluste verursacht, konnte mit einer Genauigkeit von 80% klassifiziert werden, was eine Verbesserung gegenüber früheren Ansätzen darstellt.