新聞詳情

T2T基因組組裝的進展、 挑戰(zhàn)與前景

74
發(fā)表時間:2024-06-10 15:28

近日,李恒教授在Nature Review Genetics(IF=42.69)發(fā)表了題為“Genome assembly in the telomere-to-telomere era”的綜述論文,該綜述詳細(xì)總結(jié)了目前T2T組裝的發(fā)展過程,重點討論了如何獲得接近端粒到端粒的組裝,并展望了解決剩余組裝間隙和組裝非二倍體基因組所需的技術(shù)和算法進步。

640.jpg


其中,作者闡述了對于一個真正的T2T基因組組裝的界定,它必須覆蓋整個染色體且沒有間隙,并且沒有大規(guī)模的組裝錯誤。因此,在確定組裝結(jié)果是“T2T”時,必須經(jīng)過嚴(yán)格的組裝評估。除了常規(guī)的T2T基因組組裝評估指標(biāo)、如BUSCO評估、K-mer評估、比對評估等外,著絲粒等高度重復(fù)序列區(qū)的組裝質(zhì)量成果T2T的一大阻礙和檢驗標(biāo)準(zhǔn)(本公司提供著絲??茖W(xué)定義及組裝評估分析,詳見產(chǎn)品頁)。


由于PacBio HiFi和ONT超長reads的廣泛適用性,從頭組裝的基因組質(zhì)量在過去兩年中得到了顯著改善。但現(xiàn)在能自動組裝T2T基因組中的所有染色體嗎?作者認(rèn)為答案通常是否定的。作者認(rèn)為,過去幾年的大部分進步都是由于測序數(shù)據(jù)質(zhì)量的提高而取得的。目前的組裝軟件可以正確地重建基因組序列的長片段,但剩余的組裝缺口,特別是在各種非人類基因組中,仍然難以自動修補。算法改進本身可能無法可靠地解決當(dāng)前可用數(shù)據(jù)的所有基因組。期待測序技術(shù)不斷取得新進展,在沒有人為干預(yù)的情況下真正完成基因組。此外,完整的組裝只是下游生物學(xué)發(fā)現(xiàn)的第一步,基因組下游的分析工具,例如全基因組比對和基因注釋仍然面臨重大挑戰(zhàn),這需要未來持續(xù)不斷的進行改善。

分享到: