題目
基于高光譜成像分析的耕地土壤含水量反演模型研究
應用關鍵詞
高光譜圖像;土壤含水量;小波變換;CARS-SPA算法;反演模型
背景
土壤含水量(Soil moisture content, SMC)作為地表與大氣物質能量交換的中間介質,是地表植被、微生物和作物生長的重要物質因子。SMC在農業生產預測和質量因子中也發揮著重要作用。準確、快速地獲取土壤含水量可為精準農林經營和發展提供重要依據。
傳統SMC測量方案成本高、耗時長,且采集到的數據集所包含的信息有限,無法進行進一步的數據分析,因此對SMC與土壤反射率關系的測量受到了全球研究者的廣泛關注。土壤的光譜反射率受到儀器誤差和環境參數(如光、溫度和濕度)的影響。因此,在建立模型之前,需要對采集到的光譜進行預處理。這些方法包括反射率的對數一階微分法、反射率的平方根法、相對反射率法和九點移動加權平均法。雖然這些方法可以降低光譜中的背景噪聲,但仍存在處理過程復雜、特征信息無法保留等問題。考慮到小波變換具有多分辨率、低熵、低頻信號的特點,以及對隨機信號的處理能力,本研究采用小波變換方法作為預處理方法。為了去除高頻區域的噪聲,該方法將信號分解為高頻和低頻部分。這樣,處理后的數據保留了原始信號最tu出的特征,達到了提高信噪比的目的。本文采用競爭自適應重加權采樣算法(Competitive adaptive reweighted sampling algorithm, CRAS)和連續投影算法(Successive
projections algorithm, SPA)相結合的方法,從原始數據集中選取較少的波段作為反演因子,提高了反演模型的擬合度和精度。在這種情況下,簡單線性回歸和多元線性回歸算法可以簡化反演模型的復雜性和冗余度,提高預測效率,達到大面積預測SMC的目的。
本文的主要貢獻如下:(1)進行數據采集,研究耕地土壤中SMC和光譜反射率的變化規律。(2)利用小波變換和CARS-SPA算法建立SMC的簡單多元線性反演模型,具有較高的反演精度。
試驗設計
本文的研究區域位于江蘇省南京市江北新區椅山區域,共采集土壤樣品117個,其中52個樣品用于SMC檢測,65個樣品用于土壤反射光譜測量。南京農業大學鄒修國團隊利用GaiaSorter高光譜分選系統(江蘇雙利合譜)獲取每個土樣的高光譜影像,該系統配備了SpectraSENS高光譜數據采集軟件和兩個CCD像機。兩個相機高度、掃描前向速度、曝光時間等參數如表1所示。
由于光照條件、空氣濕度和光譜采集儀器等干擾因素,土壤反射率光譜容易受到噪聲的影響。為了平滑波形,提高信噪比,本研究采用離散小波變換(Discrete wavelet transform, DWT)算法進行去噪。為了選擇較少的波段作為回歸方程的自變量,本研究采用CARS-SPA算法。圖1展示了CARS算法的基本流程。
本研究采用簡單線性回歸以及多元線性回歸模型對SMC進行估測,并以RMSE、R2、MAE作為評價標準。
表1 GaiaSorter高光譜分選系統參數
圖1 CARS算法的基本流程
結論
原始波形在1000 ~ 1200 nm處存在明顯的噪聲。進行第1層到第7層小波變換后,由于去除了高頻信號,頻譜逐漸平滑。然而,頻譜的一些敏感波段被刪除了,例如,在第6層分解中仍然可以看到380 ~ 1000 nm之間的峰值,而在第7層分解中不可見。訓練結果表明,在6層“db4"分解過程中取得了良好的平滑效果,與原始數據的相關系數為0.912。圖2為全波段L6平滑圖及其部分放大圖。
圖2 小波變換與降噪結果。L6全波段平滑圖(a)和2002 ~ 2304 nm平滑效果圖(b)
圖3展示了部分采集到的SMC及其對應的反射率曲線。從圖3可以看出如下規律:(1)光譜反射率值在380 ~ 1000 nm和1000 ~ 2530 nm波段呈先升后降的趨勢,即在這兩個波段處存在反射峰。此外,在近紅外波段1000 ~ 1350 nm存在一個吸收谷。(2)在380 ~ 1000 nm范圍內,光譜反射率隨SMC的增加而逐漸減小。但在1000 ~ 2530 nm范圍,這一規律不明顯。SMC差異較大的光譜曲線一般符合光譜隨SMC增大而減小的規律。
圖3 不同SMC土壤反射率曲線
表2給出了CARS、SPA和CARS-SPA算法所選波段和RMSECV的比較。在表2中,使用CARS-SPA算法對光譜數據進行處理時,首先使用CARS對全波段進行濾波。在獲得特征波段數據集后,利用SPA進行更詳細的評估,最終獲得最佳波長。當CARS和SPA算法單獨處理全波段時,SPA算法構建的模型性能優于CARS算法,而采用CARS-SPA算法的模型的性能明顯比前兩個模型更準確。本研究結果表明CARS-SPA算法與CARS和SPA算法相比具有最少的特征數。因此,采用CARS-SPA算法不僅可以降低模型的復雜度,還可以提高模型的精度。
CARS算法首先優化124個波段,其中40個波段在695 ~ 796 nm之間,32個波段在1273 ~ 1474 nm之間。圖4顯示了使用SPA算法進一步在695 ~ 796 nm之間進行特征選擇的結果。從圖中可以看出,最終選擇了7個波段,其中RMSECV最小的位置為778 nm,此時模型擬合效果最jia。最后選取波段695 nm、711 nm、736 nm、747 nm、767 nm、778 nm和796 nm作為反演模型的因變量。
表2 CARS-SPA算法建立模型的性能
圖4 CARS-SPA算法在695 ~ 796 nm處SPA算法的波段選擇結果。模型中包含的變量數(a)以及選定變量的索引(b)。
根據CARS-SPA的選取結果,首先對優選波長進行簡單線性回歸分析。部分簡單線性反演模型及其精度結果如表3所示。反演模型的R2在0.63 ~ 0.66之間,RMSE在0.0082 ~ 0.0084之間,MAE在0.56 ~ 0.58%之間。為了提高模型的擬合精度,本文采用多元線性逐步回歸建立反演模型。從表4可以看出,多元線性回歸方程的R2較簡單線性回歸方程增大到0.75(公式2)。本研究確定由695 nm、711 nm、736 nm、747 nm、767 nm、778 nm、796 nm波段組成的多元線性反演模型用于準確地反演土壤水分信息。
表3 簡單線性反演模型及其精度
表4 多元線性反演模型及其精度
作者信息
鄒修國,博士,南京農業大學人工智能學院副教授,碩士生導師。
主要研究方向:動植物表型及智能種養殖技術(裝備)、智能儀表及數字管理、水路無人駕駛、智能機器人。
參考文獻:
Wu, T.H., Yu, J., Lu, J.X., Zou, X.G., & Zhang, W.T. (2020). Research on Inversion Model of C*ted Soil Moisture Content Based on Hyperspectral Imaging Analysis. Agriculture, 10(292).