題目
基于高光譜影像和深度卷積神經網絡的玉米種子品種分類
應用關鍵詞
高光譜成像技術、深度學習、種子純度、可見近紅外
背景
在種子品質檢測中,品種純度是一個重要的指標,影響著種子的生長和產量。然而,不同品種的玉米種子在種植、收獲、運輸和儲存等生長發育過程中可能是混合的。如果雜交玉米種子與其他品種的玉米種子混合,就會造成產量損失。傳統玉米種子分類方法存在檢測時間長、復雜度高、對種子有破壞作用等局限性。因此,亟需使用相關技術為育種者、種植者和消費者準確識別玉米品種。本文探究了高光譜成像技術與深度卷積神經網絡(DCNN)相結合對四個品種的玉米種子進行分類的可行性。
試驗設計
浙江大學成芳教授團隊利用江蘇雙利合譜公司的可見/近紅外高光譜成像系統Gaiafield-V10E,獲取了四個不同品種的玉米種子的高光譜影像,并提取了每個品種胚乳部分的平均光譜(400 – 1000 nm);基于平均光譜構建了DCNN、K近鄰(KNN)和支持向量機(SVM)三種分類模型。DCNN結構如圖1所示。
圖1 DCNN結構。DCNN的主要流程(a),Conv Block的具體流程(b),FC Block的具體流程(c)
結論
圖2 四種玉米種子的光譜。原始光譜(a);在450.26 - 978.94 nm波長范圍內提取玉米種子ROI的平均光譜(b)
對比了四個品種的平均光譜(圖2)。光譜曲線的總體趨勢非常相似,尤其是在510 -580 nm范圍內。而Jiayu538在整個光譜中表現出明顯高于Chunhua201和Qianfeng258的反射率。在4個玉米品種中,Deyu977在500 nm前和850 nm后表現出較高的反射率。450 - 700 nm的波長范圍可能與葉綠素、β-胡蘿卜素或其他與胚乳有關的成分的變化有關。短波紅外的差異可能與O-H、N-H、C-H鍵的振動有關。這些異同的存在表明不同品種的玉米種子是可以分類的。
表1 混淆矩陣以及accuracy、sensitivity、specificity、precision
分別采用KNN、SVM和DCNN模型對玉米種子品種進行分類。如表1所示,DCNN模型在accuracy、sensitivity、specificity、precision方面均獲得了好的結果,顯示了DCNN模型的*性。對于驗證集,我們可以看到三個模型的驗證集的整體結果略差于測試集。KNN、SVM和DCNN模型的accuracy分別為63.1%、86.9%和93.3%。驗證集與測試集的評價指標大小幾乎沒有區別。此外,從sensitivity、specificity、precision的值來看,數值變化不大,可見模型沒有出現過擬合現象,模型的穩定性較好。
圖3 基于SVM(a)和DCNN模型(b)的種子可視化分類圖(Chunhua201、Deyu977、Jiayu538、Qianfeng258的玉米種子分別以藍色、綠色、橙色和紅色進行可視化)
為了直觀地觀察玉米種子樣本的分類結果,利用SVM和DCNN模型實現了玉米胚乳圖像的可視化(圖5)。雖然肉眼很難判斷玉米種子樣品之間的差異,但從最終的化學圖像中可以明顯地識別出各個品種的玉米種子。可以看到,在320個測試玉米種子中,基于DCNN模型的分類圖中只有4個玉米種子被錯分類。準確率為98.75%,與上述分析結果相似。
以上研究表明了,通過結合高光譜成像技術和DCNN可實現玉米種子品種快速、準確地區分和可視化。在未來的研究中,預計將使用更多的玉米種子品種來提高分類模型的穩定性,并開發出實時的玉米種子分類系統。
作者信息
成芳,博士,浙江大學生物系統工程與食品科學學院教授,博士生導師。
主要研究方向:智能裝備、農產食品加工質量實時在線監測自動控制技術、顯微成像光譜信息融合分析、淀粉納米晶制備改性及應用、種子納米增強等。
參考文獻:
Zhang, J., Dai, L., & Cheng, F. (2020). Corn seed variety classification based on hyperspectral reflectance imaging and deep convolutional neural network. Journal of Food Measurement and Characterization, 15, 484-494.