中國(guó)農(nóng)大新聞網(wǎng)訊 近日,中國(guó)農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院李孟華團(tuán)隊(duì)在國(guó)際知名期刊《自然·通訊》(Nature Communications)上在線(xiàn)發(fā)表題為《山羊T2T基因組組裝揭示與絨用性狀相關(guān)的變異》(Telomere-to-telomere genome assembly of a male goat reveals variants associated with cashmere traits)原創(chuàng)性研究成果。該研究從T2T基因組的組裝、著絲粒特征、Y染色體結(jié)構(gòu)、三代測(cè)序檢測(cè)結(jié)構(gòu)變異(SV)、二代重測(cè)序研究群體馴化及絨用性狀相關(guān)基因等方面,系統(tǒng)而全面地揭示了山羊T2T基因組在反芻動(dòng)物基因組研究的重要價(jià)值及廣泛應(yīng)用前景。
本研究利用PacBio HiFi(141.03 Gb,49.3×)、Ultra-long ONT(328.44 Gb,114.8×)、Bionano(1188.9 Gb)和Hi-C(435.76 Gb,152.2×)測(cè)序技術(shù),組裝了山羊首個(gè)完整基因組(T2T-goat1.0),其大小為2.86 Gb,包括20.96Mb的Y染色體。T2T-goat1.0的QV值達(dá)到了54.18,且全基因組的覆蓋度均勻。
T2T-goat1.0與山羊參考基因組ARS1具有高度共線(xiàn)性,進(jìn)一步驗(yàn)證了T2T-goat1.0的高質(zhì)量和準(zhǔn)確性。T2T-goat1.0成功填補(bǔ)了ARS1中的649個(gè)gap,并完整解析了著絲粒和端粒區(qū)域。T2T-goat1.0共鑒定到288.5Mb的之前NCBI參考基因組ARS1未解析區(qū)域(PURs),這些區(qū)域被認(rèn)為是錯(cuò)誤組裝的修正或新組裝,其中超過(guò)30 Mb位于X染色體上。這些 PURs 主要由著絲粒衛(wèi)星序列和片段重復(fù)(SDs)組成,占 PURs 總長(zhǎng)度的 81.92%(236.33 Mb)。此外,T2T-goat1.0修正了ARS1中大量的組裝結(jié)構(gòu)錯(cuò)誤,例如,18號(hào)染色體19 Mb–26 Mb區(qū)域的倒位,該倒位通過(guò)原始reads比對(duì)被確認(rèn)是 ARS1的組裝錯(cuò)誤。T2T-goat1.0 中鑒定到286.70 Mb 的非冗余片段重復(fù),其中73.28%(210.12 Mb)位于著絲粒區(qū)域,而在A(yíng)RS1中僅發(fā)現(xiàn)了55.25 Mb。
為了評(píng)估T2T-goat1.0作為參考基因組在reads比對(duì)和變異檢測(cè)的改進(jìn),研究收集了516個(gè)山羊樣本的全基因組重測(cè)序數(shù)據(jù)進(jìn)行SNP調(diào)用。與之前的參考基因組ARS1相比,使用T2T-goat1.0作為參考基因組在reads比對(duì)、變異檢測(cè)方面的表現(xiàn)也有顯著改進(jìn),T2T-goat1.0作為參考基因組時(shí),reads 比對(duì)率有所增加、比對(duì)錯(cuò)誤率降低。通過(guò)質(zhì)控和過(guò)濾,在T2T-goat1.0上鑒定了25,397,794個(gè)SNP,其中545,026個(gè)位于PURs,而在 ARS1上獲得了24,238,138個(gè)SNP。
此外,在家養(yǎng)山羊馴化的選擇特征分析中,T2T-goat1.0的完整性為識(shí)別馴化過(guò)程中的選擇信號(hào)提供了顯著優(yōu)勢(shì)?;?T2T-goat1.0 檢測(cè)的SNP 和SV,研究鑒定了位于PURs的與馴化相關(guān)的基因,如NKG2D和ABCC4。
對(duì)于羊絨性狀的基因組選擇特征分析,除了先前已報(bào)道的與羊絨相關(guān)的基因(如FGF5和EDA2R)外,在 PURs還發(fā)現(xiàn)了274個(gè)選擇信號(hào),覆蓋了72個(gè)基因。在Chr12的PURs(CHI12: 14.88 Mb–16.58 Mb)中,鑒定到了ABCC4基因的選擇信號(hào)。共線(xiàn)性分析表明,ARS1中該區(qū)域的組裝不完整,而在T2T-goat1.0中,該區(qū)域包含了14個(gè)串聯(lián)重復(fù)的ABCC4基因。
總之,山羊T2T基因組全面解析了復(fù)雜的基因組區(qū)域,如著絲粒、端粒、重復(fù)序列和Y染色體,為研究基因組結(jié)構(gòu)與功能提供了更完整、更準(zhǔn)確的信息。該基因組改進(jìn)了短讀長(zhǎng)和長(zhǎng)讀長(zhǎng)的比對(duì)能力,提高了變異檢測(cè)的準(zhǔn)確度,并鑒定出多個(gè)此前未報(bào)道的受選擇信號(hào),為深入理解山羊的遺傳多樣性、馴化過(guò)程及性狀選擇提供了可靠的依據(jù)。山羊完整基因組的破譯不但為山羊研究提供了重要的遺傳資源,還將促進(jìn)其在生物技術(shù)領(lǐng)域的廣泛應(yīng)用。
中國(guó)農(nóng)業(yè)大學(xué)為論文第一單位,動(dòng)物科學(xué)技術(shù)學(xué)院博士生吳慧、羅凌云、張雅慧和內(nèi)蒙古農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院張崇妍為共同第一作者,中國(guó)農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院李孟華教授、草業(yè)科學(xué)與技術(shù)學(xué)院賈善剛副教授和內(nèi)蒙古農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院劉志紅教授為共同通訊作者。該工作得到了國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家生物育種重大科技項(xiàng)目、國(guó)家自然科學(xué)基金、中國(guó)農(nóng)業(yè)科學(xué)院北方農(nóng)牧業(yè)技術(shù)創(chuàng)新中心項(xiàng)目、中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專(zhuān)項(xiàng)和第二次青藏高原科學(xué)考察研究項(xiàng)目的資助。