安徽省農業科學院土壤肥料研究所利用我司高光譜設備,通過高光譜成像技術研究辣椒葉片葉綠素含量與光譜之間的定量關系,為大面積、快速檢測植被葉綠素含量變化提供了可能。
此研究選取150組不同生長期的辣椒葉片作為研究對象,分別采集辣椒葉片的高光譜圖像和葉綠素含量后,進行辣椒葉片葉綠素含量定量模型的預測研究。我司高光譜成像系統如圖1、圖2所示。
圖1 GaiaSoter-Dual“蓋亞"雙相機全波段高光譜分選儀
圖2 Gaiafiled-Pro-V10E相機及參數
通過選取如圖3所示的6處具有代表性的矩形感興趣區(避開葉脈)作為樣本的原始光譜,加權平均后的光譜值作為原始光譜數據。去掉383~399 nm和950~1000 nm邊緣噪聲較大的光譜數據,保留400~949 nm進行下一步研究(如圖4所示)。
圖3.辣椒葉片取樣區域
Fig3. Sampling area of pepper leaves
圖4原始光譜曲線
Fig 4. original spectral curve
通過隨機森林算法選擇得到重要性最高的前20個波段,如圖5所示。分別為697.1 nm、932.1nm、941.9 nm、693.6 nm、857.4 nm、930.8 nm、543.4 nm、927.1 nm、803.3 nm、550.1 nm、806.9 nm、785.4 nm、704.1 nm、890.1 nm、916 nm、530 nm、533.1 nm、556.8 nm、771.1 nm、536.7 nm,從上述所選波段分布來看,主要集中于可見光波段(390~780 nm),這可能與光合作用的波段主要是可見光波段有關。
圖5.隨機森林特征重要性
Fig 5 Importance of random forest characteristics
將經隨機森林特征選擇算法篩選后的波段作為自變量,SPAD值作為因變量。利用線性回歸(Linear Regression, LR)、偏最小二乘回歸(Partial Least Squares Regression, PLSR)、梯度提升回歸樹(Gradient Boosting Regressor Tree, GBRT)、隨機森林回歸(Random Forest regression, RFR)分別構建反演模型。表1為4種模型的建模效果精度對比,圖6為4種模型的驗證集驗證效果。
表1 不同算法精度對比
Table1 Accuracy comparison of different algorithms
模型Model | 建模Modeling | 驗證Verification | ||||
LR | 0.93 | 1.77 | 1.41 | 0.83 | 2.39 | 1.89 |
PLSR | 0.86 | 2.6 | 2.1 | 0.87 | 2.05 | 1.75 |
GBRT | 0.99 | 0.54 | 0.42 | 0.87 | 2.06 | 1.7 |
RFR | 0.97 | 1.29 | 1.05 | 0.90 | 1.87 | 1.43 |
圖6.實測值與預測值關系
Fig 6. Relationship between measured and predicted values
研究結果表明:(1)隨機森林特征選擇算法篩選后波段構建的模型精確度和可靠性較高,其中隨機森林回歸相對于其他回歸方法,模型精度最高,其驗證集的 R2為0.9、RMSE為1.87、MAE為1.43。說明模型具有較高的穩定性和預測精度,可以滿足實際預測需求,其次利用隨機森林特征選擇算法很大程度上降低了模型的復雜度,從而提高了模型的預測精度和穩定度,達到簡化模型的目的。
(2)利用隨機森林特征選擇算法篩選的波段結合隨機森林回歸可以較為穩定的預測辣椒葉片葉綠素含量,為后期大面積檢測辣椒的生長狀況提供了理論依據。
(3)選用辣椒葉片為研究對象,但從特征波段的選擇和模型構建來說,對于其他農作物也具有重要的參考性,在今后的研究可以嘗試將該方法應用到其他植被葉片。
通訊作者簡介:
葉寅,博士,安徽省農業科學院土壤肥料研究所助理研究員。
主要研究方向:1、面源污染防治與模擬。2、景觀生態學以及土地利用/覆被變化的生態環境效應。
參考文獻:袁自然,葉寅,武際,方凌,陳曉芳,楊欣.基于高光譜成像技術的辣椒葉片葉綠素含量估算[J].江蘇農業科學,2021,49(16):189-193.DOI:10.15889/j.issn.1002-1302.2021.16.035.