眾所周知酷宵,人類有二十三對(duì)染色體,其中第二十三對(duì)是決定性別的躬窜。2020年7月14日浇垦,科學(xué)家們首次獲得人類X染色體的完整序列,讓我們來看看吧荣挨!
經(jīng)過科學(xué)家近二十年的努力男韧,人類染色體基因組序列迄今為止是最準(zhǔn)確和完整的脊椎動(dòng)物基因組序列朴摊,但仍有數(shù)百個(gè)未知的空白或缺失的DNA序列。這些缺口通常包含重復(fù)的DNA片段此虑,非常難以測序甚纲,但是這些重復(fù)片段卻是控制人類遺傳信息變異最豐富的區(qū)域之一,可能隱藏著理解人類生物學(xué)和疾病很重要的信息朦前。
為了避免分析正常人體細(xì)胞中兩個(gè)染色體發(fā)生的DNA變異贩疙,在新研究中研究人員沒有對(duì)來自正常人類細(xì)胞的X染色體進(jìn)行排序,而是使用了一種特殊的細(xì)胞類型——有兩個(gè)相同的X染色體况既。它比一般的男性細(xì)胞(XY)多一條X染色體,同時(shí)又能避免分析典型的女性細(xì)胞(XX)時(shí)會(huì)遇到的兩條染色體的序列差異的問題组民。
人類基因組非常長棒仍,包含約60億個(gè)堿基。任何DNA測序儀器都無法一次性完全讀取所有的堿基信息臭胜。因此莫其,簡單來說,研究人員需要把基因組分成更小的片段耸三,就像把把一幅圖畫切割成拼圖的一小塊乱陡。然后,再對(duì)每一塊的信息進(jìn)行分析仪壮,最后把這些短片段拼回到整幅圖中去憨颠。
在這幅“拼圖”中,DNA重復(fù)序列在基因組中非常普遍积锅,它們一直是巨大的挑戰(zhàn)爽彤。大多測序技術(shù)只能制造出長度很小的“短片段讀取”,重復(fù)序列就會(huì)導(dǎo)致許多看起來幾乎完全相同的短片段出現(xiàn)缚陷。這就好像在拼圖中出現(xiàn)了一大片藍(lán)天适篙,這里的每一塊看起來并沒有什么不同,但又沒有線索告訴我們這些片段是如何拼接在一起箫爷。
但現(xiàn)在嚷节,測序技術(shù)取得了長足的進(jìn)步。納米孔測序技術(shù)可以獲得包含數(shù)十萬個(gè)堿基對(duì)的“超長讀取”虎锚,這樣的長度可以跨越覆蓋整個(gè)重復(fù)區(qū)域硫痰,從而繞過了一些復(fù)雜的挑戰(zhàn)。新的突破正是由能夠?qū)崿F(xiàn)“超長讀取”的新測序技術(shù)實(shí)現(xiàn)的翁都。借助這些技術(shù)碍论,團(tuán)隊(duì)制造出了一個(gè)全基因組的組裝,它在連續(xù)性柄慰、完整性和準(zhǔn)確性等方面超過了之前所有人類基因組組裝鳍悠,甚至在某些指標(biāo)上超越了當(dāng)前人類參考基因組税娜。
接下來,剩余的中斷部位就是在著絲粒藏研,也可以理解成染色體兩條“腿”交叉的地方敬矩。這是一個(gè)出了名的難題,因?yàn)檫@里存在著大量重復(fù)DNA蠢挡。在X染色體中弧岳,著絲粒包含的高度重復(fù)的DNA區(qū)域跨越了310萬個(gè)堿基對(duì)。團(tuán)隊(duì)成功識(shí)別出了重復(fù)序列中的變異业踏,將它們作為標(biāo)記禽炬,用這些變異來排列長段的讀取,再將它們連接在一起勤家,從而完成了整個(gè)著絲粒區(qū)域腹尖。下一步則是利用來自多種測序技術(shù)的數(shù)據(jù)的完善策略,從而確保序列中每個(gè)堿基的準(zhǔn)確性伐脖。
納米孔測序除了能提供超長讀取之外热幔,還可以檢測被甲基化修飾的堿基——這是一種“表觀遺傳”的變化,也就是說讼庇,它不會(huì)改變序列绎巨,但對(duì)DNA結(jié)構(gòu)和基因表達(dá)有著重要影響。通過繪制X染色體上甲基化模式的圖譜蠕啄,研究人員能夠證實(shí)之前的一些觀察场勤,并揭示著絲粒內(nèi)甲基化模式的一些有趣的趨勢。
研究人員相信介汹,我們已經(jīng)來到了“一個(gè)完整基因組序列的時(shí)代”却嗡。我們也希望在不遠(yuǎn)的將來,隨著科技的發(fā)展嘹承,我們可以解決一個(gè)又一個(gè)的難題窗价,成就一番事業(yè)。
今天的長圖就到這里啦叹卷!謝謝大家撼港!