新聞詳情

著絲粒分析助力玉米Mo17基因組完整組裝

5
發(fā)表時(shí)間:2023-12-09 16:44作者:伊斯通生物科技

2023-12-9-3 mol17.jpg

      2023年6月15日,中國農(nóng)業(yè)大學(xué)農(nóng)學(xué)院、國家玉米改良中心、玉米生物育種全國重點(diǎn)實(shí)驗(yàn)室賴錦盛教授團(tuán)隊(duì)以題為“A complete telomere-to-telomere assembly of the maize genome”在國際知名期刊Nature Genetics《自然·遺傳學(xué)》上在線發(fā)表了玉米全基因組所有染色體端粒到端粒完整無間隙組裝結(jié)果,在復(fù)雜動(dòng)植物基因組中第一個(gè)實(shí)現(xiàn)真正意義上的全基因組完整無間隙組裝。該研究是復(fù)雜基因組組裝領(lǐng)域工程技術(shù)研究的重大突破,攻克了復(fù)雜動(dòng)植物基因組組裝的最后一道難題,是基因組組裝和基因組學(xué)研究的一個(gè)重要里程碑。

     

本世紀(jì)初,多國科學(xué)家共同參與的被譽(yù)為生命科學(xué)“登月計(jì)劃”的人類基因組草圖公布。盡管并不完整,卻在生物醫(yī)學(xué)領(lǐng)域產(chǎn)生了深遠(yuǎn)的影響,同時(shí)也極大推動(dòng)了基因組學(xué)的發(fā)展。隨后,擬南芥、小鼠、水稻、玉米等幾百個(gè)物種的參考基因組序列草圖相繼公布。然而由于基因組的復(fù)雜性,特別是大量重復(fù)序列的存在,組裝過程中大量高度相似的DNA序列碎片難以被正確的還原到準(zhǔn)確的基因組位置上,使得參考基因組存在大量未知的“空白”區(qū)域。很長時(shí)間來,實(shí)現(xiàn)一個(gè)物種所有染色體從端粒到端粒(T2T)都完整無缺的基因組組裝是基因組學(xué)研究人員遙遠(yuǎn)的夢想。

近年來,經(jīng)過數(shù)十個(gè)研究機(jī)構(gòu)的近百名科學(xué)家組成的國際科研團(tuán)隊(duì)(T2T聯(lián)盟)的共同努力,基于只含單個(gè)親本基因組的細(xì)胞系(不含Y染色體),完成了完整的無間隙的人類單親本細(xì)胞系基因組序列組裝(不含Y染色體),朝著完成真正的完整人類基因組組裝邁進(jìn)了一大步。同時(shí),在植物基因組學(xué)領(lǐng)域,多個(gè)相對比較小的模式物種基因組(擬南芥、水稻等)的大部分染色體實(shí)現(xiàn)了T2T的完整無間隙組裝陸續(xù)發(fā)表,但絕大部分基因組依然存在不同程度的未組裝區(qū)域。迄今為止,包括人類、擬南芥和水稻等在內(nèi),還沒有一個(gè)復(fù)雜動(dòng)植物基因組(基因組比較大,包含幾百或幾千個(gè)以上核糖體DNA拷貝)實(shí)現(xiàn)全基因組所有染色體的完整無間隙組裝。

玉米是世界范圍內(nèi)的重要作物,其基因組組裝對玉米基礎(chǔ)研究和分子育種均有重要意義。同時(shí),玉米也是經(jīng)典的復(fù)雜基因組研究的模式植物。自2009年玉米基因組草圖公布以來,已有近50個(gè)不同玉米自交系基因組被組裝。然而,由于玉米基因組大(與人類基因組相近),且擁有超過80%的重復(fù)序列,目前已報(bào)道的玉米基因組都存在數(shù)百或數(shù)千個(gè)“空白”區(qū)域未被解析。

Mo17自交系是經(jīng)典的玉米雜種優(yōu)勢群Lancaster群的代表。Mo17自交系及其衍生材料在我國玉米生產(chǎn)中被廣泛應(yīng)用。賴錦盛教授團(tuán)隊(duì)以Mo17自交系為材料,綜合利用了約237×的ONT Ultralong和約69.4×的Pacbio HiFi測序數(shù)據(jù),完成了最新的玉米基因組組裝,其大小為2,178.6 Mb,每條染色體的端粒到端粒均由一條完整連續(xù)的序列組成,堿基精確度超過99.99%。最新的組裝不僅在過去高質(zhì)量組裝的基礎(chǔ)上增加了1029個(gè)基因,還解鎖了玉米基因組中結(jié)構(gòu)最為復(fù)雜、從未被組裝的基因組空白區(qū)。這是首個(gè)完整的、無間隙的玉米基因組序列,也是首個(gè)所有染色體都完整組裝的復(fù)雜動(dòng)植物基因組。



9d34cffbb05745468d45c381b3a445cf.png

                     圖1. Mo17基因組完整組裝



完整Mo17基因組的組裝,使人們第一次有機(jī)會(huì)對玉米基因組組裝中最具挑戰(zhàn)性區(qū)域的序列和結(jié)構(gòu)特征一探究竟。大部分植物擁有上千個(gè)45S rDNA。通過完整組裝,研究人員發(fā)現(xiàn)玉米的核仁組織區(qū)長達(dá)26.8 Mb,包含有2,974個(gè)45S rDNA拷貝,其區(qū)域內(nèi)rDNA復(fù)制和轉(zhuǎn)座子插入模式高度復(fù)雜。在此之前,植物中核仁組織區(qū)完整組裝的物種僅含有數(shù)十個(gè)45S rDNA拷貝。另外,研究人員還發(fā)現(xiàn)玉米基因組內(nèi)存在主要由TAG三核苷酸重復(fù)組成的超長簡單序列富集區(qū),長度可達(dá)1.56 Mb,包含近30萬個(gè)TAG拷貝,其中連續(xù)的TAG重復(fù)序列最長達(dá)235 kb。此外,對完整基因組組裝的分析也揭示了大量存在于不同著絲粒間和不同亞端粒區(qū)的基因組序列和結(jié)構(gòu)變異。這些研究結(jié)果對進(jìn)一步理解高等植物基因組復(fù)雜性和功能具有重要意義。

149b5fb39ace48baa828a5ae4b1dc1d6.png


圖2. 玉米核仁組織區(qū)基因組結(jié)構(gòu)和45S rDNA拷貝數(shù)


分享到: