近日,信息學院(人工智能學院)許福教授團隊在農業人工智能方向取得重要研究進展,成功構建了面向中國農作物病蟲害領域的知識圖譜—CropDP-KG。該成果以《A knowledge graph for crop diseases and pests in China》為題,發表在Nature子刊《Scientific Data》上。該期刊專注于數據集以及促進科學數據共享和再利用的研究,SCI Q1期刊,五年影響因子8.7。

農作物病蟲害是影響全球農業生產的重要因素,每年造成嚴重經濟損失。傳統病蟲害知識分散在不同平臺、文獻和數據庫中,缺乏統一、結構化的表示方法,制約了農業智能決策的發展。針對這一難題,研究團隊依托自然語言處理技術與農業領域知識,從“中國農作物病蟲害圖文數據庫”中提取并構建了覆蓋廣泛、結構清晰的多維知識圖譜。
CropDP-KG包含8類核心實體(如病害、害蟲、作物、發生區域、癥狀等)和7類語義關系(如“主要發生地區”“危害作物”“適宜溫度”等),共包含13,840個實體和21,961個關系三元組。研究采用BERT-BiLSTM-CRF等深度學習模型實現實體識別,并結合專家標注與驗證,確保知識的高準確性與可靠性。

基于該知識圖譜,團隊還開發了“農作物病蟲害知識服務系統”,支持知識查詢、問答與可視化功能,用戶可通過關鍵詞快速檢索病蟲害相關屬性、發生條件、防治建議等多維度信息,為農業從業者、科研人員及政策制定者提供直觀、高效的知識支持。該知識圖譜數據已以CSV格式公開發布于Figshare平臺,系統代碼開源發布在GitHub,推動農業知識共享與后續研究應用。
論文第一作者為青年教師顏榮恩,通訊作者為許福教授和李冬梅教授。安平、孟祥浩、李亞坤、黨德鵬教授共同參與研究。
本研究由中央高校基本科研經費(BLX202356)、國家重點研發計劃(2022YFF1302700)、國家林草局應急揭榜掛帥項目(202303)及優秀青年團隊項目(QNTD202308)共同資助。