近日,中國農業(yè)科學院北京畜牧獸醫(yī)研究所豬遺傳育種創(chuàng)新團隊搭建了Nu核支持向量機NTLS(NuSVR+TPE+LightGBM+SHAP)預測框架,該學習框架在保證計算速度的同時,顯著提高了育種值估計準確性。相關研究成果發(fā)表在《智能農業(yè)技術(Smart Agricultural Technology)》雜志。
應用機器學習等人工智能方法進行育種值預測是面向未來的育種趨勢之一。面對海量大數(shù)據(jù)選種時,需要同時兼顧計算速度、準確性及可解釋性等問題。
研究團隊開發(fā)的NTLS機器學習預測框架結合了自動參數(shù)尋優(yōu)、降維、特征提取以及決策樹解釋等策略,在應用實踐中可以顯著提高豬育種值預測準確性。研究表明,在達100kg體重日齡、背膘及產活仔數(shù)等主選性狀方面,該框架的預測準確性比GBLUP等基因組選擇方法分別提高5.1%、3.4%和1.3%。同時,此框架還可以大大降低普通機器學習計算時間,并對育種值“黑盒子”進行部分解釋。
牧醫(yī)所博士研究生王進部為本論文第一作者,王立剛研究員和高會江研究員為該文通訊作者。