世界上最柔软的人_视频一区视频二区制服丝袜_婬荡乱婬91成人网站_亚洲国产综合人成综合网站_日韩精品无码去免费专区

快速組裝全基因組在個(gè)人電腦實(shí)現(xiàn)

2021-09-18 14:26:31 來(lái)源:

科技日?qǐng)?bào)北京9月15日電 (記者張夢(mèng)然)據(jù)《細(xì)胞系統(tǒng)》雜志14日發(fā)表的一項(xiàng)研究,美國(guó)麻省理工學(xué)院(MIT)和法國(guó)巴斯德研究所的科學(xué)家開(kāi)發(fā)出一種在個(gè)人計(jì)算機(jī)上重建包括人類(lèi)基因組在內(nèi)的全基因組技術(shù)。這種技術(shù)比當(dāng)前最先進(jìn)的方法快大約一百倍,且僅使用目前五分之一的資源。這項(xiàng)研究以單詞而非字母為語(yǔ)言模型提供壓縮的構(gòu)建模塊,從而可以更緊湊地表示基因組數(shù)據(jù)。

“我們可以在一臺(tái)普通的筆記本電腦上快速組裝整個(gè)基因組和宏基因組,包括微生物基因組,”MIT計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室教授波尼·博格說(shuō),“這種能力對(duì)于評(píng)估與疾病和細(xì)菌感染(例如敗血癥)相關(guān)的腸道微生物組變化至關(guān)重要,這讓我們能夠更快地治療并挽救生命。”

自人類(lèi)基因組計(jì)劃開(kāi)展以來(lái),基因組組裝項(xiàng)目取得了長(zhǎng)足的進(jìn)步,該計(jì)劃于2003年完成了首個(gè)完整的人類(lèi)基因組組裝,耗資約27億美元,并進(jìn)行了十多年的國(guó)際合作。雖然目前完成人類(lèi)基因組組裝已不再需要耗費(fèi)數(shù)年時(shí)間,但仍然需要幾天時(shí)間和強(qiáng)大的計(jì)算機(jī)能力。第三代測(cè)序技術(shù)雖可提供具有數(shù)萬(wàn)個(gè)堿基對(duì)的、太字節(jié)數(shù)量級(jí)的高質(zhì)量基因組序列,但事實(shí)上,將如此巨量數(shù)據(jù)的基因組進(jìn)行組裝,仍具有挑戰(zhàn)性。

為了超越當(dāng)前技術(shù)從而更有效地進(jìn)行基因組組裝,包括在所有可能的讀數(shù)對(duì)之間進(jìn)行成對(duì)比較,博格及其同事此次將研究目標(biāo)轉(zhuǎn)向了語(yǔ)言模型。他們基于“de Bruijn”圖(一種用于基因組組裝的簡(jiǎn)單、高效的數(shù)據(jù)結(jié)構(gòu))概念,開(kāi)發(fā)了一種極小空間“de Bruijn”圖,它使用被稱(chēng)為“極小值”的短核苷酸序列,代替單個(gè)核苷酸。

博格表示:“極小空間‘de Bruijn’圖只存儲(chǔ)總核苷酸的一小部分,同時(shí)保留了整個(gè)基因組結(jié)構(gòu),使它們比經(jīng)典‘de Bruijn’圖更有效?!毖芯咳藛T利用新方法為661406個(gè)細(xì)菌基因組的集合構(gòu)建了一個(gè)索引,這是迄今為止同類(lèi)集合中最大的一個(gè)。他們發(fā)現(xiàn),這項(xiàng)新技術(shù)可在13分鐘內(nèi)搜索整個(gè)集合中的抗菌素抗性基因,而使用標(biāo)準(zhǔn)序列比對(duì)這一過(guò)程需要7小時(shí)。

總編輯圈點(diǎn)

基因組組裝對(duì)于基因組分析的“前途”十分關(guān)鍵,這其實(shí)是一個(gè)把測(cè)序產(chǎn)生的讀取片段經(jīng)過(guò)拼接再生成基因組堿基序列的過(guò)程。聽(tīng)起來(lái)很繞,但基因組組裝確實(shí)是生物信息學(xué)領(lǐng)域的核心問(wèn)題,因?yàn)楫?dāng)前測(cè)序技術(shù)獲得的序列一般都比較短,需要組裝拼接成較長(zhǎng)的、完整的序列,才能用于進(jìn)一步分析。這一直以來(lái)都是很繁冗的一個(gè)步驟,但現(xiàn)在本文中的成果,讓科學(xué)家們實(shí)現(xiàn)了在最省力的設(shè)備中、在最短的時(shí)間內(nèi),完成了更為精準(zhǔn)的組裝。

標(biāo)簽:

為您推薦

新聞快訊