MUSES9-HS高光譜相機(jī)應(yīng)用方向
對(duì)植物病害和植物脅迫的可靠檢測和識(shí)別是目前農(nóng)業(yè)領(lǐng)域的一大挑戰(zhàn)?,F(xiàn)有的標(biāo)準(zhǔn)檢測方法通常依賴于農(nóng)作物學(xué)家手動(dòng)檢查作物上可見的癥狀,還要受限于作物的類型和作物面積的大?。▽?duì)于許多商業(yè)作物來說,面積往往很大),這種監(jiān)測植物健康的方法既費(fèi)時(shí)又費(fèi)力。人工檢測還依賴于病害或壓力表現(xiàn)出明顯的癥狀,而這些癥狀經(jīng)常在病害的中后期才表現(xiàn)出來,再通過人工檢測或診斷性測試來確定病原體。疾病通常從葉片上的一個(gè)小區(qū)域開始(例如,由真菌病原體Mycosphaerellagraminicola引起的小麥Septoria tritici blotch(STB);由Venturiainaequalis引起的蘋果瘡痂),如果作物很大,目視檢查可能很難發(fā)現(xiàn),而能夠在這個(gè)早期階段識(shí)別疾病將會(huì)提供一個(gè)早期干預(yù)的機(jī)會(huì),在整個(gè)作物被感染或損害之前,控制、預(yù)防感染的擴(kuò)散,或改變作物管理方法。識(shí)別受疾病影響的作物區(qū)域還有助于針對(duì)性地應(yīng)用化學(xué)品。這種精確的方法將可以減少農(nóng)藥和除草劑用量,從而對(duì)環(huán)境、生態(tài)系統(tǒng)服務(wù)、種植者的成本和最終消費(fèi)者產(chǎn)生有利影響。因此,農(nóng)業(yè)和園藝部門對(duì)用更自動(dòng)化的、有針對(duì)性的和精確的方法來取代這種人工觀察的過程有著濃厚的興趣。Mahlein發(fā)表了關(guān)于通過成像傳感器檢測植物病害的文獻(xiàn),其中包括RGB、多光譜、高光譜、熱能、葉綠素?zé)晒夂腿S傳感器。最終觀點(diǎn)是,RGB和高光譜成像對(duì)于識(shí)別特定疾病的效果來說是比較好的。
為了改善作物管理和植物健康,一些研究集中在如何在開始階段識(shí)別到病害,要在出現(xiàn)明顯跡象之前。圖像分析技術(shù)在這方面顯示出很大的潛力,它們代表了檢測植物中生物和非生物壓力的非侵入性和潛在的自主方法。Singh等人在最近的一篇論文中說明了這一點(diǎn),該論文研究了用于脅迫表型的機(jī)器學(xué)習(xí),探討了使用不同傳感器進(jìn)行脅迫識(shí)別、分類、量化和預(yù)測的高通量表型。
作為一個(gè)研究領(lǐng)域,圖像分析代表了大量的計(jì)算技術(shù),能夠從數(shù)字圖像中提取信息。從實(shí)用的角度來看,這意味著對(duì)精心捕捉的圖像進(jìn)行自動(dòng)處理,從圖像中產(chǎn)生所需測量的數(shù)據(jù)集。圖像本身可以來自各種來源,從彩色數(shù)碼相機(jī)或智能手機(jī),到更專業(yè)的相機(jī),旨在捕捉圖像中的各種不同信息。這里的一個(gè)技術(shù)進(jìn)步是高光譜圖像,相機(jī)捕捉到的不僅僅是傳統(tǒng)數(shù)字圖像中常見的三個(gè)彩色光帶。本論文將特別關(guān)注隨后的分析方法,即高光譜圖像分析。由于技術(shù)成本的下降,這種方法最近在經(jīng)濟(jì)上已經(jīng)可以被廣大用戶所接受。正在開發(fā)的分析方法使高光譜成像技術(shù)能夠被用于更廣泛的應(yīng)用。高光譜成像在很大的光譜范圍內(nèi)使用高保真顏色反射信息(超出人類視覺范圍),因此有可能識(shí)別植物生長和發(fā)展中的微小變化。
在這篇評(píng)論中,我們概述了高光譜成像技術(shù),以及如何在實(shí)驗(yàn)室和田間應(yīng)用中利用它來分類和識(shí)別植物葉子疾病和壓力的早期階段。從背景理論和高光譜成像技術(shù)的概述開始,我們考慮了該方法在植物和作物科學(xué)中的一些應(yīng)用范圍。最后,我們討論了這些方法的一些實(shí)際問題;這是一個(gè)重要的方面,因?yàn)檫@種相機(jī)通常還不能作為作物監(jiān)測的交鑰匙解決方案,所以在這些技術(shù)的部署可以在商業(yè)環(huán)境中實(shí)施之前,必須注意收集令人滿意的數(shù)據(jù),并提供有意義的分析和解釋。
1. 彩色數(shù)字成像
為了理解高光譜技術(shù)本身,首先考慮一下一個(gè)標(biāo)準(zhǔn)的、非高光譜的彩色數(shù)字圖像包括哪些內(nèi)容,這將是很有幫助的。光的波長對(duì)應(yīng)于顏色,藍(lán)光的中心波長約為475納米,綠光為520納米,紅光為650納米。一幅彩色圖像代表了三個(gè)寬波段的組成,紅、綠、藍(lán)。我們的眼睛包含三種類型的錐體,對(duì)光譜中的藍(lán)色、綠色和紅色部分敏感,每一種錐體都有一個(gè)顏色范圍,它們受到的刺激或強(qiáng)或弱,取決于發(fā)射光的波長。結(jié)合來自三種不同錐體的信息,我們在大腦中重建了一個(gè)彩色圖像。數(shù)字圖像試圖模擬錐體的敏感性,一個(gè)像素存儲(chǔ)了光譜中藍(lán)色、綠色或紅色部分的綜合強(qiáng)度,這取決于放置在該像素前端的過濾器類型。高光譜系統(tǒng)中捕獲的光線范圍也會(huì)有所不同。人眼可見的顏色是電磁波譜上的一個(gè)小范圍,從400到700納米(圖1)。通常用于植物高光譜成像的光譜部分從紫外線(UV)(始于約250納米)到短波紅外(SWIR,約2500納米)。照相機(jī)通常捕捉某個(gè)子范圍,如可見光和近紅外范圍(VIS-NIR,400-1300納米)或短波紅外(1300-2500納米)或紫外線(250-400納米),這些范圍在一些傳感器中被結(jié)合起來以增加光譜的覆蓋范圍。
那么,彩色圖像就是一個(gè)三波段多光譜圖像的例子,其中每個(gè)波段記錄了三種顏色中的一種,即紅、綠和藍(lán)。在真正的多光譜圖像中,通常會(huì)有更多的波段,也許還會(huì)對(duì)光譜中的紅外區(qū)域的光進(jìn)行采樣,即波長超過700納米的光。另一方面,高光譜圖像通常包含光譜范圍內(nèi)數(shù)百個(gè)連續(xù)的窄波段。這種方法產(chǎn)生了密集的、信息豐富的彩色數(shù)據(jù)集,具有足夠的空間分辨率,每片葉子有數(shù)百個(gè)數(shù)據(jù)點(diǎn)(像素)。
對(duì)于植物和植被,非常有用的分析波長范圍是可見光范圍和近紅外范圍。這個(gè)波長范圍可以捕捉到葉子色素(400-700納米)和間葉細(xì)胞結(jié)構(gòu)(700-1300納米)的變化,但是要看到植物的含水量的變化,需要擴(kuò)展范圍(1300-2500納米)。例如,嚴(yán)重脫水會(huì)影響葉子的中葉結(jié)構(gòu),這與近紅外反射率的變化有關(guān),然而,輕微的干旱壓力通常不會(huì)有足夠的影響,無法被檢測到。
2. 高光譜成像技術(shù)
高光譜成像光譜儀背后有各種硬件方法,這意味著有不同的方式來捕獲圖像。成像的設(shè)備包括推掃器、濾波輪、液晶可調(diào)諧過濾器等等。在一個(gè)使用推掃的案例中,入射光線通過一個(gè)凸面光柵(或棱鏡),將光線分離成狹窄的波長。這種分離后面會(huì)被記錄在一個(gè)光敏芯片上(類似于標(biāo)準(zhǔn)的數(shù)碼相機(jī))。一個(gè)推掃器,有三個(gè)組成部分;照相機(jī)、光譜儀和鏡頭。這個(gè)系統(tǒng)同時(shí)捕捉圖像的單一空間線,以及整個(gè)彩色光譜范圍。然后相機(jī)或物體被移動(dòng),下一條線被捕獲(掃帚被"推"向前方,因此而得名),有效地使相機(jī)成為線掃描器,最終的圖像是在全部掃描完成后建立的。替代推掃的另一種方法是快照方法,即一次性采集整個(gè)圖像。迄今為止,推掃技術(shù)得到了很多的使用,但最近快照技術(shù)的進(jìn)步正在增加與表型和分析有關(guān)的接受度和可能性。
在本綜述的其余部分,我們考慮了高光譜成像技術(shù)和分析的應(yīng)用,并將綜述分為以下四個(gè)部分:(1)現(xiàn)有的植被和病害指數(shù);(2)健康和有病植物的檢測和分類與病害分類的應(yīng)用;(3)量化病害的嚴(yán)重程度;以及(4)早期階段檢測壓力癥狀。
在這些章節(jié)中,我們將考慮基于實(shí)驗(yàn)室的成像方法,以及基于現(xiàn)場的遙感。除了明顯的生物差異外,值得考慮這些環(huán)境對(duì)高光譜圖像數(shù)據(jù)本身的影響?;趯?shí)驗(yàn)室的成像方法是在一個(gè)受控的環(huán)境中進(jìn)行的,其中包括人工光源。室外遙感數(shù)據(jù)通常取決于環(huán)境光照,盡管有一些系統(tǒng)使用受控照明進(jìn)行室外高光譜成像的例子。使用自然光照,即太陽,意味著認(rèn)識(shí)到存在著大氣效應(yīng),如光的吸收和散射。其他可能導(dǎo)致光譜特征變化的環(huán)境因素有:云影和物體表面之間的相互作用、一天中的時(shí)間、鏡面反射和其他物體的存在,它們可以將二次照明反射到感興趣的區(qū)域。由于這些影響中的許多都與時(shí)間有關(guān),成功使用校準(zhǔn)參考意味著每當(dāng)環(huán)境照明發(fā)生變化時(shí)都要更新參考,這在自然照明情況下可能非常短的時(shí)間。在受控的照明下,仍然存在問題:存在著光強(qiáng)度的問題:反平方定律指出,照度會(huì)根據(jù)與光源的距離成反比下降。這意味著會(huì)出現(xiàn)不均勻的照明,選擇的光源類型需要仔細(xì)考慮,它不應(yīng)該有橫跨光譜或圖像平面的高強(qiáng)度峰值。
實(shí)驗(yàn)室和現(xiàn)場成像之間的另一個(gè)潛在差異是分辨率。對(duì)于航空遙感數(shù)據(jù),空間分辨率通常在每像素米的范圍內(nèi),這意味著像素通常包含一種以上材料的特征。分析這種數(shù)據(jù)的第一步是考慮這種多金屬問題,即必須考慮像素包含混合材料(稱為"混合像素"),并且必須應(yīng)用光譜解混過程。換句話說,一個(gè)像素可能包含植物和土壤,必須使用算法來確定適當(dāng)?shù)幕旌?。在?shí)驗(yàn)室中,圖像通??梢栽谥参锏膸桌迕追秶鷥?nèi)拍攝,甚至可能有許多像素代表一片葉子或疾病區(qū)域。在這些情況下,一般沒有必要進(jìn)行解混。
對(duì)這些基于位置的挑戰(zhàn)的進(jìn)一步考慮將在本評(píng)論的后面充分探討,但在我們繼續(xù)之前,讓我們考慮一下為什么我們希望首先捕獲這種高光譜信息。
3. 應(yīng)用于健康和患病植物的檢測和分類
在本節(jié)中,我們將討論專門用于檢測植物中生物壓力的各種技術(shù)。分類技術(shù),也就是把數(shù)據(jù)分成健康和病害兩類的技術(shù),可以分為兩種類型:一種是專注于光譜中一些關(guān)鍵波長的技術(shù),另一種是使用整個(gè)光譜反應(yīng)的技術(shù)。更進(jìn)一步說,疾病分類的討論涉及到多種疾病的識(shí)別和特定疾病的檢測。
3.1現(xiàn)有的植被和疾病指數(shù)
在高光譜成像設(shè)備出現(xiàn)之前,希望根據(jù)顏色信息對(duì)效果進(jìn)行量化的研究人員已經(jīng)使用多光譜成像或高光譜、點(diǎn)源設(shè)備(如不產(chǎn)生空間圖像的光譜儀)來獲取顏色數(shù)據(jù)。高光譜設(shè)備一般不提供點(diǎn)對(duì)點(diǎn)的測量。相反,用戶有很大的責(zé)任來開發(fā)捕獲過程。一旦獲得,必須對(duì)產(chǎn)生的大量數(shù)字?jǐn)?shù)據(jù)集進(jìn)行分析,以提供有用的信息。進(jìn)入這種大型數(shù)據(jù)集的一個(gè)明智而簡單的方法是只考慮波長范圍內(nèi)的少數(shù)位置,觀察在光譜中預(yù)定的關(guān)鍵點(diǎn)的不同條件的變化。使用這種方法,我們還可以通過考慮數(shù)據(jù)值的比率來抵消相對(duì)光變化的影響。這涉及到兩個(gè)或多個(gè)波長的組合,通常被稱為"指數(shù)"。
為了解釋這些數(shù)據(jù),通過預(yù)先考慮的生物推理(例如知道特定的波長與特定的細(xì)胞結(jié)構(gòu)的特性有關(guān)),或者由于采集設(shè)備所能提供的特定波長的限制(例如從衛(wèi)星多光譜遙感數(shù)據(jù)中得出的指數(shù)可能只有有限的波長可以使用),已經(jīng)開發(fā)了一些此類指數(shù)。當(dāng)應(yīng)用于植物材料時(shí),這些指數(shù)被稱為"植被指數(shù)"。存在許多不同的植被指數(shù),每一種指數(shù)都使用不同的波長測量來描述植被的生理屬性,考察植物的一般屬性或其生長的具體參數(shù)。
非常流行和廣泛的指標(biāo)之一是歸一化差異植被指數(shù)(NDVI),它被用來測量作物的一般健康狀況。它是通過近紅外光和可見光的簡單比率來計(jì)算的(見表1)。NDVI已被用于許多不同的目的,例如,檢測由Sunnpest谷物害蟲EurygasterintegricepsPut.(Hemiptera:Scutelleridae)在小麥中造成的壓力。大多數(shù)指數(shù)是非常具體的,只對(duì)它們所設(shè)計(jì)的數(shù)據(jù)集有良好的效果。有一些以疾病為中心的研究專注于創(chuàng)建疾病指數(shù)來檢測和量化特定的疾病,例如,一項(xiàng)研究使用葉銹病嚴(yán)重程度指數(shù)(LRDSI)檢測小麥的葉銹?。≒ucciniatriticina),準(zhǔn)確率為87-91%,然而,據(jù)我們所知,它還沒有被廣泛測試。
另一種常用的方法是檢測紅色/近紅外邊界處反射率突然增加的變化。這個(gè)"紅邊"位置是電磁波譜中的一個(gè)狹窄部分(690-740納米),可見光譜結(jié)束,近紅外開始(圖2)。這一段在規(guī)格反應(yīng)(導(dǎo)數(shù))上有很大的變化,對(duì)于綠色植物材料來說,由于葉綠素強(qiáng)烈吸收了700納米左右的波長,因此材料在這個(gè)范圍內(nèi)的反射率很低,但它對(duì)紅外線(從720納米左右)有強(qiáng)烈的反射。Cho描述了一些提取或檢測紅邊的不同算法。一個(gè)基于紅邊位置的疾病指數(shù)被用來檢測小麥的白粉?。˙lumeriagraminisf.sp.Tritici),然而它沒有部分最小二乘回歸(PLSR)那么準(zhǔn)確,后者是一種使用統(tǒng)計(jì)學(xué)方法的技術(shù)。我們將在本評(píng)論中進(jìn)一步考慮這些統(tǒng)計(jì)學(xué)方法中的一些。
3.2使用選定波長的子集進(jìn)行分類
在這一節(jié)中,我們考慮的是依靠全光譜中特定波長的子采樣的分類方法。與真正的多光譜數(shù)據(jù)不同的是,特定的波長可以手動(dòng)或自動(dòng)從采集范圍的任何地方選擇,而多光譜數(shù)據(jù)則受技術(shù)限制。
來自 "背景 "部分的分析通常使用指數(shù)來計(jì)算代表值,使用光譜中不同位置的離散波長。其中一項(xiàng)涉及小麥田間實(shí)驗(yàn)的研究使用了歸一化差異植被指數(shù)(NDVI)響應(yīng),從數(shù)據(jù)集中消除了除葉子以外的一切數(shù)據(jù)集,然后用一種叫做"方差分析"的統(tǒng)計(jì)方法方差分析(測量統(tǒng)計(jì)協(xié)方差),以識(shí)別選定的波段,然后用二次方鑒別分析(QDA)來對(duì)光譜進(jìn)行分類。在健康和病變?nèi)~片(黃銹?。┲g進(jìn)行分類。這代表了超規(guī)格分析的典型工作流程:隔離(或分割)圖像中感興趣的部分,然后使用數(shù)學(xué)技術(shù)來識(shí)別光譜中可能具有預(yù)測能力的區(qū)域,最后使用這些空間和光譜區(qū)域來學(xué)習(xí)分類方法。使用QDA,4個(gè)波段的總體準(zhǔn)確性達(dá)到92%。
Moshou描述了一個(gè)多層感知器(MLP)的例子,他的目的是使用范圍為460-900納米、光譜分辨率為20納米的光譜儀來檢測田間生長的小麥的黃銹病。該分光儀在現(xiàn)場使用一個(gè)手持系統(tǒng)拍攝了圖像。然后選擇了四個(gè)重要的波長。前兩個(gè)波長是使用"變量選擇"選擇的,這涉及到使用逐步判別分析和使用F檢驗(yàn)來比較波長。第二對(duì)波長使用NDVI波長。Moshou使用的神經(jīng)網(wǎng)絡(luò)是一個(gè)簡單的架構(gòu),有四個(gè)輸入,一個(gè)由十個(gè)神經(jīng)元組成的隱藏層和兩個(gè)輸出(健康和病態(tài))。架構(gòu)是由輸入的數(shù)量、選定的隱藏神經(jīng)元的數(shù)量和所需的輸出數(shù)量決定的。試驗(yàn)和錯(cuò)誤可以用來確定一個(gè)合適的結(jié)構(gòu)。Moshou嘗試了不同數(shù)量的神經(jīng)元并選擇了非常有效的。使用這種方法達(dá)到的分類精度對(duì)健康植物來說是98.9%,對(duì)病變植物來說是99.4%。
MLP方法使用一個(gè)簡單的架構(gòu),由輸入、隱藏層和輸出組成。在機(jī)器學(xué)習(xí)中,一種新的、更復(fù)雜的方法,即深度學(xué)習(xí),正在變得流行。深度學(xué)習(xí)指的是人工神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)包含很多層,在每一層中,神經(jīng)元能夠隱含地代表數(shù)據(jù)的特征,通過這樣做,可以在后面的層中獲得更復(fù)雜的信息,圖像特征由網(wǎng)絡(luò)自動(dòng)確定。深度學(xué)習(xí)方法的一個(gè)具體例子是卷積神經(jīng)網(wǎng)絡(luò)(CNN)。而人工神經(jīng)網(wǎng)絡(luò)(ANN)使用神經(jīng)元激活網(wǎng)絡(luò)作為其類似的模型。CNN則是基于視覺系統(tǒng)中的視網(wǎng)膜場。無論哪種方法,深度學(xué)習(xí)需要更長的時(shí)間來然而,深度學(xué)習(xí)需要更長的時(shí)間來訓(xùn)練,其架構(gòu)也更加復(fù)雜。然而,隨著復(fù)雜性的增加,非常令人印象深刻的分類和識(shí)別率是可以實(shí)現(xiàn)的。
深度學(xué)習(xí)已經(jīng)被應(yīng)用于植物病害檢測問題。Mohanty使用CNN檢測了14種作物的26種疾病。使用了由54,306張彩色圖像組成的數(shù)據(jù)集,80%用于訓(xùn)練,20%用于測試AlexNet和GoogLeNet(兩種流行的預(yù)訓(xùn)練CNN版本)。AlexNet的準(zhǔn)確率為97.82%,GoogLeNet的準(zhǔn)確率為98.36%,使用彩色圖像從頭開始訓(xùn)練(轉(zhuǎn)移學(xué)習(xí)的數(shù)值更高,分別為99.27和99.34%)。他們選擇了具有同質(zhì)背景的單個(gè)葉片。如果在與訓(xùn)練圖像不同的條件下對(duì)網(wǎng)絡(luò)進(jìn)行測試,準(zhǔn)確率為31.4%。Sladojevic也使用CNN檢測各種作物植物的13種疾病,包括蘋果(白粉病、銹?。?、梨(葉斑?。?、葡萄(枯萎病、螨蟲、白粉病、霜霉?。?,使用CaffeNet,準(zhǔn)確率為96.3%。
目前很少有完整的研究將深度學(xué)習(xí)應(yīng)用于高光譜數(shù)據(jù),盡管這是一個(gè)活躍的研究領(lǐng)域。為了將高光譜數(shù)據(jù)用于深度學(xué)習(xí),有幾個(gè)挑戰(zhàn)需要解決。高光譜數(shù)據(jù)的大小,包括波長的數(shù)量,需要大量的處理時(shí)間和功率,最好是需要一個(gè)圖形處理單元。超光譜波長的數(shù)量很可能包括來自特定波長的噪聲。另外,在訓(xùn)練/測試過程中,需要有足夠的數(shù)據(jù)量和標(biāo)記的數(shù)據(jù)。還有一種可能性是,誤差會(huì)比其他方法高。
其他非深度學(xué)習(xí)方法包括Yuan,使用FishersLinearDiscriminantAnalysis與遙感數(shù)據(jù)檢測小麥作物的黃銹病和白粉病,總體準(zhǔn)確率為93%,選擇的波長范圍(531,570-654,685-717nm)對(duì)檢測白粉病和黃銹病在這些規(guī)格反射范圍內(nèi)的差異有意義,結(jié)果是獨(dú)立t檢驗(yàn)。
有時(shí),數(shù)據(jù)分析方法與簡單的圖像處理步驟相結(jié)合,以增加特征識(shí)別。一系列被稱為形態(tài)學(xué)運(yùn)算符的圖像處理技術(shù)可以用來清理二元(黑白)圖像。其中一種技術(shù)叫做侵蝕,通過將邊界像素變成背景像素來縮減物體的前景。相反的技術(shù)被稱為"擴(kuò)張",其效果是擴(kuò)大前景物體的邊界。它們可以一起用于填補(bǔ)孔洞,或去除二進(jìn)制標(biāo)記數(shù)據(jù)中的斑點(diǎn)噪聲(取決于使用的順序)。使用這種方法的一種方法是對(duì)黃瓜葉子數(shù)據(jù)的研究,在這個(gè)例子中,這種技術(shù)被用來分析不同類型的霉菌;霜霉?。≒seudoperonosporacubensis)。首先應(yīng)用原則成分分析(PCA)來減少數(shù)據(jù)的大小,并產(chǎn)生一個(gè)二進(jìn)制圖像,然后在第二步中使用侵蝕和擴(kuò)張來增強(qiáng)疾病特征。準(zhǔn)確率為90%,但是只使用了20個(gè)樣本(10個(gè)健康的和10個(gè)感染的)。這種方法不太可能在其他高光譜圖像上有很好的效果來檢測疾病,除非葉片數(shù)據(jù)相似,即使如此,結(jié)果也是不確定的。
高光譜成像也可以與顯微鏡相結(jié)合,以更高的分辨率捕捉圖像。對(duì)具有不同基因型的大麥進(jìn)行了微觀層面的研究,以了解是否可以確定基因型之間的光譜差異。還分析了健康和患病植物的大麥葉片,這些植物被接種了白粉?。˙.graminis)。結(jié)果表明,除了那些含有霜霉病基因座o(mlo)的品種外,健康和接種的葉片之間存在著時(shí)間上的差異,該基因座提供了植物對(duì)B.graminis的抗性。在這項(xiàng)研究中,由于噪聲的影響,光譜范圍被縮小到420-830納米,然后用Savitzky-Golay濾波器進(jìn)行歸一化和平滑處理,然后用SiVM來尋找極端光譜,接著用Dirichlet聚集回歸來尋找葉痕。
3.3使用全光譜數(shù)據(jù)進(jìn)行分類
分類方法的目的是將數(shù)據(jù)分為若干不同的類別。它們源于一系列的統(tǒng)計(jì)或機(jī)器學(xué)習(xí)技術(shù)。其中一種方法是二次判別分析(QDA),它通過使用協(xié)方差矩陣來進(jìn)行分類,該矩陣將各個(gè)類別進(jìn)行比較。QDA方法被用于牛油果植物的研究,以檢查真菌疾病月桂樹枯萎?。≧affaelealauricola),使用位于田間和玻璃溫室的植物。QDA的分類準(zhǔn)確率為94%。當(dāng)然,在分析管道的每個(gè)階段都有可能使用替代方法。例如,不使用QDA,而是使用決策樹方法(一種機(jī)器學(xué)習(xí)技術(shù)),其準(zhǔn)確率達(dá)到95%。為數(shù)據(jù)選擇正確的方法,以及確保足夠的數(shù)據(jù)集大小和質(zhì)量,是關(guān)鍵。這種機(jī)器學(xué)習(xí)方法代表了一套越來越常見的分類和預(yù)測算法。機(jī)器學(xué)習(xí)方法使用訓(xùn)練數(shù)據(jù)集來訓(xùn)練算法,目的是分析和預(yù)測新的、未見過的數(shù)據(jù)的結(jié)果。多層網(wǎng)絡(luò)(MultilayerLowe)是這種技術(shù)的一個(gè)例子。MLP是簡單的網(wǎng)絡(luò)(稱為人工神經(jīng)網(wǎng)絡(luò)),將輸入數(shù)據(jù)映射到輸出。這個(gè)過程是基于對(duì)神經(jīng)元激活網(wǎng)絡(luò)的生物學(xué)理解,其中信息在神經(jīng)元之間被發(fā)射。輸入節(jié)點(diǎn)連接到輸出,使用激活函數(shù)和權(quán)重進(jìn)行更新,可以優(yōu)化產(chǎn)生正確的輸出(使用訓(xùn)練數(shù)據(jù))。這種算法需要先驗(yàn)知識(shí)(訓(xùn)練數(shù)據(jù)),因此,如果"疾病光譜"是未知的,那么這種技術(shù)將是不適合的。
第三種分類方法是通過使用導(dǎo)數(shù)來觀察規(guī)格特征;這時(shí)要分析數(shù)據(jù)的基本模式或變化。二階(及以上)導(dǎo)數(shù)通常對(duì)光照的變化不敏感;但是它們對(duì)高光譜數(shù)據(jù)通常遭受的噪聲敏感,因此在使用導(dǎo)數(shù)之前需要應(yīng)用"平滑"。平滑化是一個(gè)過程,利用平均化的形式減少單個(gè)像素強(qiáng)度和相鄰像素之間的差異,以創(chuàng)造一個(gè)更平滑的信號(hào)。兩個(gè)平滑的例子是Savitsky-Golay和高斯過濾。Savitszky-Golay提出了一種通過對(duì)輸入數(shù)據(jù)的子集擬合局部多項(xiàng)式來平滑噪聲數(shù)據(jù)的方法,然后在單點(diǎn)評(píng)估多項(xiàng)式來平滑信號(hào)。高斯濾波通過使用高斯加權(quán)核對(duì)中心信息進(jìn)行平均化,從而減少噪聲。
Huang試圖通過使用帶有一階和二階導(dǎo)數(shù)的偏最小二乘回歸(PLSR)來檢測芹菜作物的硬霉菌腐爛病。部分最小二乘法回歸選擇一組小的成分。這種技術(shù)在預(yù)測因子是串聯(lián)的/高度相關(guān)的情況下是有用的,它將減少對(duì)數(shù)據(jù)的過度擬合的風(fēng)險(xiǎn)。使用原始光譜的偏最小二乘回歸的分類精度為88.92%,使用Savitzky-Golay一階導(dǎo)數(shù)的PLSR為88.18%,使用二階導(dǎo)數(shù)的PLRS為86.38%。準(zhǔn)確率相似,二階導(dǎo)數(shù)的表現(xiàn)稍差。Yuan在Fisher的線性判別分析(FLDA)上使用PLSR來檢測小麥的病蟲害。它對(duì)蚜蟲危害的準(zhǔn)確率為60%,對(duì)黃銹病的準(zhǔn)確率為92%。在另一項(xiàng)研究中,Zhang使用FLDA檢測小麥的白粉?。ㄊ褂脟?yán)重受損的葉片),準(zhǔn)確率超過90%。
3.4疾病識(shí)別
除了檢測疾病的存在,研究的另一個(gè)方向是區(qū)分不同的疾病,以確定特定的病原體。其中一種方法是光譜信息分歧分類。該方法比較了觀察到的光譜和參考光譜(光譜庫,或數(shù)據(jù)中感興趣的平均光譜)之間的分歧,分歧值越小,光譜就越相似,如果它們大于設(shè)定的閾值,則不被歸類為參考光譜。光譜信息分歧被用來檢測柑橘類水果(葡萄柚)上的柑橘軍團(tuán),數(shù)據(jù)的光譜范圍是450-930納米,有92個(gè)波段,其中有1個(gè)波段的數(shù)據(jù)。5.2納米的光譜分辨率。在分析數(shù)據(jù)之前,通過合并相鄰的像素來減少一半的尺寸,進(jìn)行了預(yù)處理步驟。腐爛的葡萄果實(shí)與正常的葡萄果實(shí)以及出現(xiàn)其他疾病或損害癥狀的葡萄果實(shí)進(jìn)行了比較,包括:油漬、昆蟲損害、黑色素、結(jié)痂和風(fēng)疤;這種方法的分類準(zhǔn)確率為95.2%。
4. 量化疾病的嚴(yán)重程度
在檢測和分類疾病的同時(shí),我們可能希望記錄疾病的有效數(shù)量,或其嚴(yán)重程度。這種方法確實(shí)遇到了一些特殊的挑戰(zhàn)。病害對(duì)葉片的損害和覆蓋程度會(huì)影響葉片被歸類為健康或病害的準(zhǔn)確性。極端的病害會(huì)影響葉片的外觀,以至于它們可能根本就不能被算作植物材料。盡管如此,仍有許多方法可以估計(jì)嚴(yán)重程度,下面我們介紹一些方法。
光譜角度映射器(SAM)方法將像素光譜與參考光譜相匹配,通過計(jì)算光譜之間的角度對(duì)像素進(jìn)行分類,這些光譜被視為空間中的n維向量。這種技術(shù)已被廣泛用于高光譜數(shù)據(jù)的分類,包括植物病害,并取得了一定的成功。Yuhas研究了收獲前小麥鐮刀菌頭孢病的嚴(yán)重程度。高光譜數(shù)據(jù)的波長范圍為400-1000納米,光譜分辨率為2.5納米。SAM用于檢測病害的數(shù)量,分類準(zhǔn)確率為87%。對(duì)小麥植物進(jìn)行了兩個(gè)實(shí)驗(yàn),一個(gè)在玻璃溫室,一個(gè)在田間。對(duì)植物從接種到建立感染的整個(gè)發(fā)展階段進(jìn)行了成像。Yuhas確定,在感染后,健康和受感染的植物是無法區(qū)分的,因?yàn)楦腥具€沒有建立。然而,當(dāng)高光譜數(shù)據(jù)在成熟階段被檢查時(shí),小麥的色素組成發(fā)生了變化,健康的植株就會(huì)顯示為患病的植株。
Mahlein使用同樣的技術(shù)來分析甜菜病害,特別是Cerospora葉斑病、白粉病和葉銹病。范圍是400-1000納米,2.8納米的光譜分辨率和0.19毫米的空間分辨率。在一段時(shí)期內(nèi)(>20天)對(duì)植物進(jìn)行分析,以監(jiān)測每種病害的不同階段,并將葉片分類為健康或病害。Cerospora葉斑病的分類精度取決于疾病的嚴(yán)重程度(89.01-98.90%),白粉病的精度在90.18-97.23%之間,甜菜銹病達(dá)到61.70%,在第20天之前沒有使用SAM進(jìn)行分類。
Rumpf等人使用了與Mahlein相同的數(shù)據(jù)集,但采用了不同的分析方法;決策樹(DT)、人工神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量機(jī)(SVM)。所有的方法都需要先驗(yàn)知識(shí),但是一旦經(jīng)過訓(xùn)練就被證明是有效的。例如,對(duì)于Cerospora葉斑病,SVM的準(zhǔn)確率為97%(DT為95%,ANN為96%);對(duì)于甜菜銹病,準(zhǔn)確率為93%(DT為92%,ANN為95%);而對(duì)于白粉病,準(zhǔn)確率為93%(DT為86%,ANN為91%)。在病害覆蓋了1-2%的葉片后,用葉片面積覆蓋率測量嚴(yán)重程度,準(zhǔn)確率為62-68%,對(duì)于超過10%的葉片覆蓋率,準(zhǔn)確率幾乎為100%。這表明,在同一組高光譜數(shù)據(jù)上使用各種分析方法來闡明不同的見解并達(dá)到不同的準(zhǔn)確度--選擇技術(shù)很重要。表2列出了用于識(shí)別特定疾病的常用技術(shù)以及與之相關(guān)的準(zhǔn)確性。
5.檢測早期的壓力癥狀
這種檢測系統(tǒng)的最終目標(biāo)是在對(duì)植物進(jìn)行最少的物理改變的情況下識(shí)別疾病。盡可能早地識(shí)別疾病或非生物問題有明顯的好處。通過使用高光譜技術(shù)與適當(dāng)?shù)姆治龇椒ㄏ嘟Y(jié)合,我們可以現(xiàn)實(shí)地希望在人工觀察之前識(shí)別壓力癥狀。
干旱對(duì)許多作物來說是一個(gè)重大問題,特別是一些植物種類或品種在一段時(shí)間內(nèi)不會(huì)明顯顯示出這種壓力,到這時(shí),作物的潛在產(chǎn)量或質(zhì)量可能已經(jīng)下降,因?yàn)橹参锏恼0l(fā)育過程已經(jīng)通過壓力反應(yīng)受到影響。干旱的定義也可以從少量缺水到完全缺水不等。本節(jié)所討論的研究在植被指數(shù)檢測到干旱之前就已經(jīng)檢測到了干旱的發(fā)生,而且是在明顯跡象出現(xiàn)之前幾天。
特別是在干旱脅迫的早期檢測中,有一項(xiàng)技術(shù)已經(jīng)成為流行的技術(shù),那就是單純體積最大化(SiVM),它是一種數(shù)據(jù)聚類技術(shù)。這種技術(shù)選擇健康和受壓植物的光譜特征,然后用這些類別對(duì)數(shù)據(jù)進(jìn)行聚類。當(dāng)簽名變得與預(yù)先學(xué)習(xí)的樣本簽名相似時(shí),它就被歸類為此類。
Romer研究了包含在防雨棚中的大麥試驗(yàn)和在田間種植的玉米試驗(yàn)中的干旱壓力。用來檢測壓力的技術(shù)是單純的體積最大化,這是一種無監(jiān)督的技術(shù)。光譜范圍為400-900納米,光譜分辨率為4納米。在預(yù)處理過程中,一些波長由于噪聲而被去除(<470和>750納米)。這是高光譜數(shù)據(jù)常見的情況,因?yàn)楣庾V范圍末端的光線不足,特別是基于實(shí)驗(yàn)室的光源,可能在光譜的這些區(qū)域沒有產(chǎn)生很多光線。為了減少數(shù)據(jù)的大小并去除背景,采用了K-means聚類方法,用平均顏色將數(shù)據(jù)分成選定的若干組。然后將SiVM與四種眾所周知的植被指數(shù)--NDVI、光化學(xué)反射指數(shù)(PRI)、紅邊滲透點(diǎn)(REIP)和類胡蘿卜素反射指數(shù)(CRI)進(jìn)行比較。對(duì)于大麥的數(shù)據(jù),使用SiVM(第9天)比Vegeta-tionIndices(第13天)更早發(fā)現(xiàn)部分水脅迫的減少。對(duì)于無水/完全干旱條件下的植物,植被指數(shù)在第8天檢測到脅迫,比SiVM快一天,但它們未能在第9天和第10天檢測到脅迫;然而SiVM確實(shí)從第9天開始可靠地檢測到脅迫植物。
Behmann還使用支持向量機(jī)(SVM)分析了大麥的干旱壓力。這種算法是超視距的,需要標(biāo)記的訓(xùn)練數(shù)據(jù),在這種情況下,它被標(biāo)記為干旱或健康。在用SVM分析之前,數(shù)據(jù)經(jīng)過K-means預(yù)處理,以減少數(shù)據(jù)集的大小。光譜范圍為430-890納米,光譜分辨率為4納米。使用這種方法,Behmann在第6天檢測到干旱壓力,在第16天檢測到NDVI差異。
小麥的干旱脅迫已經(jīng)通過兩種組合技術(shù)進(jìn)行了分析,試圖提高檢測率。Moshou使用最小二乘支持向量機(jī)(LSSVM)來嘗試檢測干旱脅迫。在溫室中研究了小麥植物,并對(duì)光譜反射和熒光進(jìn)行了分析。熒光包括使用高強(qiáng)度的光來激發(fā)植物組織,使其發(fā)出不同波長的光,這可以用來獲得額外的生物洞察力。LSSVM需要進(jìn)行訓(xùn)練,846個(gè)數(shù)據(jù)樣本被用于訓(xùn)練,而302個(gè)數(shù)據(jù)樣本被用于測試階段。對(duì)于一些技術(shù)來說,由于計(jì)算時(shí)間的原因,數(shù)據(jù)集的大小和/或波長的數(shù)量將決定分析數(shù)據(jù)的時(shí)間。因此,Moshou使用了六個(gè)波長-503、545、566、608、860和881納米。LSSVM對(duì)脅迫葉片的準(zhǔn)確率達(dá)到76.3%,對(duì)健康葉片的準(zhǔn)確率達(dá)到86.6%。然而,該研究指出,通過使用融合光譜和熒光特征的LSSVM模型,總體準(zhǔn)確率大于99%。熒光是對(duì)葉子中葉綠素?zé)晒獾臏y量,以確定生理變化。
根據(jù)Kersting,許多這些技術(shù)很難用于非機(jī)器學(xué)習(xí)或數(shù)據(jù)挖掘?qū)<遥驗(yàn)楦吖庾V數(shù)據(jù)需要預(yù)先處理或適應(yīng)(即尋找葉片或使用選定的波長)。此外,除了之外,其他技術(shù)都沒有對(duì)大量植物進(jìn)行幾天的分析。當(dāng)有大量的數(shù)據(jù)需要分析時(shí),這是植物表型分析需要考慮的一個(gè)重要因素。Ker-Sting聲稱擁有第一個(gè)使用高光譜數(shù)據(jù)進(jìn)行干旱壓力預(yù)測的人工智能技術(shù)。開發(fā)了一種新的方法,其中包括一種不調(diào)整數(shù)據(jù)或縮小尺寸的干旱預(yù)測技術(shù)。Kersting在一個(gè)大麥干旱實(shí)驗(yàn)中展示了該方法,其數(shù)據(jù)是在五周內(nèi)收集的。使用的技術(shù)被稱為Dirichlet聚集回歸(DAR),它是基于矩陣因子化的。首先,SimplexVol-umeMaximisation被用來從數(shù)據(jù)中找到50個(gè)光譜特征并對(duì)它們進(jìn)行分類。然后,在對(duì)這些值使用高斯過程之前,對(duì)潛在的迪里切特聚集值進(jìn)行估計(jì),以找到每個(gè)植物和每個(gè)時(shí)間點(diǎn)的干旱程度。最后,在出現(xiàn)明顯跡象之前,該過程預(yù)先預(yù)測受干旱影響的植物。根據(jù)一個(gè)為期五周的大麥實(shí)驗(yàn),干旱的預(yù)測發(fā)生在可見跡象出現(xiàn)之前的1.5周。對(duì)SiVM和DAR的運(yùn)行時(shí)間進(jìn)行了評(píng)估,結(jié)果是并行的SiVM的運(yùn)行時(shí)間為30分鐘,而使用DAR模型只需幾分鐘。這表明,開發(fā)定制的分析技術(shù)可以超越現(xiàn)有方法的直接應(yīng)用(無論是在計(jì)算時(shí)間、所需假設(shè)、易用性還是最終的準(zhǔn)確性方面)。
6.高光譜數(shù)據(jù)采集和軟件
高光譜數(shù)據(jù)的尺寸很大,尤其是對(duì)多種植物進(jìn)行連續(xù)幾天的成像時(shí)。對(duì)一種植物的掃描可以很容易地達(dá)到大約一千兆字節(jié)的大小。如果對(duì)整個(gè)光譜范圍進(jìn)行分析,那么這個(gè)過程將比選擇幾個(gè)波段進(jìn)行分析要長得多。然而,有大量的信息數(shù)據(jù)中包含的信息可能是有價(jià)值的。研究人員必須決定使用多少光譜分辨率,以及放棄多少。如果你的相機(jī)收集了800個(gè)光譜帶,你必須問自己是否需要所有的800個(gè)光譜帶,還是分成400個(gè)或200個(gè)等光譜帶就足夠了。這類似于對(duì)RGB圖像使用類似JPEG的壓縮方式。這種壓縮創(chuàng)造了更小的文件尺寸,但代價(jià)破壞了圖像信息(特別是色彩信息)。儲(chǔ)存較少的光譜帶會(huì)產(chǎn)生較小的文件大小,并降低數(shù)據(jù)分析的復(fù)雜性,但代價(jià)是丟掉潛在的重要顏色屬性。Polder等人探討了使用三個(gè)系統(tǒng)設(shè)置的攝譜儀的校準(zhǔn)和特性。實(shí)驗(yàn)研究了不同類型的噪聲和信噪比。實(shí)驗(yàn)還確定,通過計(jì)算分辨率、光譜范圍和像素?cái)?shù)量,在一定程度上可以進(jìn)行分選而不損失信息。
6.1高光譜相機(jī)的設(shè)置
在分析之前,需要對(duì)高光譜數(shù)據(jù)進(jìn)行校準(zhǔn),以確保產(chǎn)生的圖像由于存在的照明顏色而得到調(diào)整;相機(jī)軟件可能有此選項(xiàng),但如果沒有,則可在捕獲數(shù)據(jù)后進(jìn)行校準(zhǔn)。照明是通過一個(gè)已知的白平衡目標(biāo)進(jìn)行校準(zhǔn)的,它由相機(jī)系統(tǒng)成像。這個(gè)目標(biāo)將在光譜上反映一個(gè)已知的百分比的光,例如,在相機(jī)的整個(gè)工作光譜上反映99%。照明的非均勻性可以通過將觀察到的數(shù)據(jù)除以捕獲的白平衡數(shù)據(jù)來校正[49]。此外,系統(tǒng)必須對(duì)傳感器在無光情況下出現(xiàn)的電噪聲(稱為暗電流)進(jìn)行校正。這通常是通過在沒有任何光線的情況下用相機(jī)拍攝圖像來進(jìn)行的,并使用由此產(chǎn)生的低水平噪聲讀數(shù)來調(diào)整未來的措施。
一個(gè)重要的問題是多長時(shí)間進(jìn)行一次白平衡校準(zhǔn)。在實(shí)驗(yàn)室環(huán)境中,每個(gè)月只拍攝一個(gè)白平衡目標(biāo)可能是合適的。實(shí)驗(yàn)中,假設(shè)照明已經(jīng)達(dá)到一個(gè)平衡點(diǎn)(即燈泡已經(jīng)完全預(yù)熱)。然而,在實(shí)驗(yàn)室外,照明受到的變化要大得多。云層、陰影和一天中的時(shí)間都會(huì)非常影響外面的光線顏色,因此必須定期進(jìn)行白平衡讀數(shù),以確保準(zhǔn)確的校準(zhǔn)。還必須仔細(xì)選擇一天中拍攝圖像的時(shí)間,以及是否在陰天和陽光直射的情況下進(jìn)行拍攝(這可能導(dǎo)致陰影和鏡面反射的問題--植物上的亮斑直接反射照明源(即太陽))。還應(yīng)考慮照明的均勻性--傳感器是否在其空間范圍內(nèi)記錄了均勻的亮度水平?一種被稱為漸暈的效果會(huì)導(dǎo)致鏡頭邊緣的像素看起來比中心的像素更暗。
7.結(jié)論
近年來,專注于利用高光譜圖像分析檢測植物壓力的科學(xué)文獻(xiàn)顯著增加。植物病害檢測是農(nóng)業(yè)和園藝作物管理中的一項(xiàng)重要活動(dòng)。特別是,檢測早期的壓力和疾病將對(duì)農(nóng)民和種植者有利,因?yàn)樗鼘⑹乖缙诟深A(yù)有助于減輕作物損失和降低作物質(zhì)量。高光譜成像是一個(gè)非侵入性的過程,通過掃描植物來收集高分辨的數(shù)據(jù)。該技術(shù)正變得越來越流行,因?yàn)橄鄼C(jī)生產(chǎn)成本的下降使研究人員和開發(fā)人員能夠更多地使用這種技術(shù)。有各種技術(shù)可用于分析數(shù)據(jù),以檢測植物的生物和非生物脅迫,本評(píng)論中討論了其中的例子,重點(diǎn)是健康和患病植物的分類、疾病的嚴(yán)重程度和脅迫癥狀的早期檢測。
植被和疾病指數(shù)的數(shù)量每年都在增加。顯著的波長組合在一起可以表明特定物種的健康或疾病狀況。然而,指數(shù)對(duì)于檢測植被的具體標(biāo)準(zhǔn)是很有價(jià)值的;指數(shù)是根據(jù)當(dāng)時(shí)的數(shù)據(jù)集、物種和對(duì)實(shí)驗(yàn)有利的條件選擇的。有些指數(shù)更具有普遍性;NDVI、PRI和其他幾個(gè)植被指數(shù)將致力于發(fā)現(xiàn)植物的一般健康狀況。但一般來說,要把為植物X設(shè)計(jì)的指數(shù)應(yīng)用于植物Y的數(shù)據(jù)集是比較困難的。這就是考慮在光譜上采用更大范圍的波長的動(dòng)機(jī),這有可能產(chǎn)生更好的結(jié)果。
摘自:Hyperspectralimageanalysistechniquesforthedetectionandclassificationoftheearlyonsetofplantdiseaseandstress:AmyLowe,NicolaHarrisonandAndrewPFrench