泛基因組學習:第一天枪芒,了解泛基因組

文章轉載自 微分基因公眾號http://www.sohu.com/a/273345614_100126902

僅供個人學習之用彻况。目前想學習泛基因組的知識,把所看到的的文獻記錄下舅踪,便于后期復習

近年來纽甘,高通量測序技術的迅猛發(fā)展,極大地推動了全基因組測序工作的展開抽碌。隨著測序技術的發(fā)展悍赢,測序成本的越來越低,這大大加快了動植物基因組的研究進程货徙,之前要花幾百上千萬才能完成的一個動植物De novo測序左权,現(xiàn)在可能幾十萬就可以搞定了,因此現(xiàn)在普通的實驗室也可以對感興趣的物種進行測序破婆,獲得其基因組序列涮总。

據(jù)不完全統(tǒng)計胸囱,全球已經(jīng)有幾百種動植物完成了全基因組測序工作祷舀。某物種有了基因組序列之后,就可以通過重測序烹笔,將得到的reads直接與參考基因組進行比對裳扯,獲得其它個體或群體的變異情況,進而對該物種進行群體進化谤职、遺傳多樣性饰豺、性狀定位等相關研究。不過隨著大量重測序工作的進行允蜈,人們也發(fā)現(xiàn)單一個體的基因組并不能完全涵蓋這個物種的所有遺傳信息冤吨,也就不能完全代表這一物種,比如說參考基因組序列里可能會缺少某些基因饶套,那么我們就沒有辦法分析這個基因在其它材料中的變異情況了漩蟆,比如人們發(fā)現(xiàn)小麥基因組中國春序列里就沒有PFT基因;水稻日本晴序列里沒有Sub1A妓蛮、SNORKEL1怠李、SNORKEL2、Pstol等基因蛤克。因此就有必要進行泛基因測序捺癞。

泛基因組概念及發(fā)展歷程

那么什么是泛基因組(pan-genome)呢?說白了构挤,泛基因組就是多個基因組的集合髓介。泛基因組包括核心基因組(core genes)和非必需基因組(variable genes):

核心基因組由所有樣本中都存在的序列組成,一般與物種生物學功能和主要表型特征相關筋现,反映了物種的穩(wěn)定性版保,核心基因穩(wěn)定的存在于多個基因組中呜笑,與重要的生物學功能和表型特征相關,多數(shù)是一些持家基因(House-keeping genes)彻犁。

非必需基因組由僅在單個樣本或部分樣本中存在的序列組成叫胁,一般與物種對特定環(huán)境的適應性或特有的生物學特征相關,反映了物種的特性汞幢。如下圖展示的是7個野生大豆的核心基因集及非必需基因集(種間亮紫色部分是7個大豆的核心基因家族驼鹅,其它顏色代表的是存在與一個或兩個大豆材料中的非必需基因家族)。泛基因組一般是通過對不同品種材料進行基因組測序森篷,組裝输钩,將組裝好的序列進行整合,從而獲得這個物種全部的遺傳信息仲智,并對每個個體進行變異檢測买乃。


image.png

泛基因組的概念最早是在微生物中提出來的,2005年钓辆,Tetin H等人提出微生物泛基因組概念剪验,指出核心基因組指的是在所有菌株中都存在的基因;非必需基因組指的是僅在部分菌株中存在的基因前联。隨后功戚,2009年Li R等對多個人類個體基因組進行拼接,發(fā)現(xiàn)了個體特有的DNA序列和功能基因似嗤,從而提出了“人類泛基因組”的概念啸臀,也就是人類群體基因序列的總和。之后烁落,在動植物領域開始了泛基因組的研究乘粒。目前水稻、玉米伤塌、大豆灯萍、小麥、甘藍等重要的植物及鳥類寸谜、陸生水生動物竟稳、昆蟲等都進行了泛基因組研究工作。

前面我們已經(jīng)了解了什么是泛基因組熊痴,及泛基因組的發(fā)展歷程他爸,那么泛基因組都能用來做什么呢?進行泛基因組測序果善,構建泛基因組圖譜诊笤,可以豐富該物種的遺傳信息,完善該物種的基因集巾陕。之后可以進行以下的相關工作讨跟,比如變異檢測纪他,獲得SNP、CNV(copy number variation)晾匠、PAV(presence-absence variation)等茶袒,而這些差異往往會有重要的農(nóng)藝性狀有關,從而可以挖掘重要性狀相關的基因資源凉馆,為科學育種提供指導薪寓;另外可以用核心單拷貝基因構建系統(tǒng)發(fā)育樹,進行系統(tǒng)進化的研究澜共,了解物種的起源及演化等重要生物學問題向叉;也可以選用不同生態(tài)地理類型的種質資源進行泛基因組測序開展物種的適應性進化,外來物種入侵性等問題的研究嗦董;另外還可以進行重要通路基因的變異研究等等母谎。

下面我們就通過幾篇文獻看下泛基因組測序具體都能做哪些工作吧。

【 文獻一 】

Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice

栽培稻京革、野生稻的遺傳多樣性是水稻育種的主要來源奇唤。大規(guī)模的重測序能夠發(fā)現(xiàn)水稻中的等位基因變異,但是通過將測序的reads直接比對到日本粳稻(O. sativa japonica Nipponbare)的參考基因組序列中會丟掉很多的遺傳變異信息存崖,因此作者對66個水稻種質進行了高深度的測序冻记,然后進行了組裝睡毒,構建了水稻的泛基因組圖譜来惧。并進行了以下相關的研究。

對66份栽培稻和野生稻平均進行了115X的測序演顾,進行了組裝供搀,得到了每份材料的基因組序列,contig N50在21Kb到75Kb之間钠至。之后與Nipponbare進行了變異檢測葛虐,鑒定到了16,563,789 SNPs,5,549,290 indels和933,489 SV棉钧。并分析了這些變異位點的次要等位基因的數(shù)量與頻率的關系及在編碼區(qū)和非編碼區(qū)的情況屿脐。并對所研究的材料構建了系統(tǒng)進化樹了解了材料的分類情況。

image.png

通過7個與馴化有關的基因位點對6個水稻群體進行進化分析宪卿,發(fā)現(xiàn)群體Aus不完全處于栽培稻水稻分支上的诵,從而提出Aus群體處于不完全馴化選擇狀態(tài)。

分析了5個與開花時間佑钾、抗寒性西疤、谷物重量、分蘗角度休溶、植株高度有關的基因Hd3a代赁、COLD1扰她、GW6a、TAC1芭碍、Sd1在不同材料間的變異情況徒役,從而追溯這些重要功能等位基因的種群起源。


image.png

進行了PAV分析窖壕,發(fā)現(xiàn)日本晴基因組中缺失的基因數(shù)目為10,872個廉涕,并發(fā)現(xiàn)缺失主要是由于種質資源中的大indels所致或者是位于日本晴基因組序列中沒有組裝出來的部分。分析還發(fā)現(xiàn)在≥60個水稻品種中存在的基因數(shù)目為26,372個艇拍,為水稻的核心基因集狐蜕;<60個水稻品種中存在的基因數(shù)為16,208個,為水稻的非必須基因集卸夕。非必需基因集主要在生物和非生物脅迫條目上富集层释。同時作者嘗試預測增加水稻個體數(shù)時基因總數(shù)的變化。發(fā)現(xiàn)當N=67時編碼基因(42,580)的數(shù)量接近平穩(wěn)期,進一步增加水稻樣本數(shù)快集,對基因集的影響不大贡羔。

【 文獻二 】

The pangenome of hexaploid bread wheat

小麥是全球種植面積范圍最廣、最重要的糧食作物之一个初,小麥的改良對于維持日益增長的人口及環(huán)境變化帶來的食品安全至關重要乖寒。面包小麥基因組大,且80-90%為重復序列院溺,且為六倍體楣嘁,因此人們付出了很大的精力才獲得了小麥的基因組序列。

在本研究中珍逸,來自澳大利亞的科學家首先對Chinese Spring的數(shù)據(jù)重新進行了組裝逐虚,改善了組裝效果,將長度大于1Kb的重復序列比例由7%降低到0.004%谆膳。并將之前公布的18個小麥的測序數(shù)據(jù)(每個小麥的測序深度在8.4X到20.0X)與重新組裝的Chinese spring基因組序列進行比對叭爱,將沒有比對上的數(shù)據(jù)進行過濾去污染后進行了組裝,得到了221,991個scaffolds漱病,總的長度為350Mb买雾,并進行了基因注釋,共得到了21,653個基因杨帽。從而將小麥序列提高了3.3%漓穿。這里需要注意的是,這篇文獻與上篇水稻的略有不同睦尽,上篇水稻文獻是對每個材料的數(shù)據(jù)進行單獨組裝器净,而本文則是先進行比對,隨后對沒有比對上的序列進行組裝当凡。2015年Yao等人對1483個水稻的研究中也是采用了這種局部組裝的方法山害。

隨后作者基于將每個品種的reads與pangenome序列比對的方法分析了每個基因的presence or absence纠俭。平均每個小麥含有128,656個基因,19個小麥都包含的核心基因集為89795個浪慌。同時估計現(xiàn)代栽培小麥的基因個數(shù)為140500 ±102個(見下圖)冤荆。同時發(fā)現(xiàn)了Chinese Spring獨有的基因有245個,而其它18個小麥中有但在Chinese Spring中沒有的基因個數(shù)為12150個权纤。對非必需基因進行了注釋钓简,功能富集分析表明非必需基因主要與環(huán)境脅迫和防御反應有關的。

image.png

基于基因的presence-absence variation汹想,構建了這19個材料的系統(tǒng)進化樹外邓,發(fā)現(xiàn)Chinese spring位于進化樹的基部。


image.png

以上的研究為小麥作物改良提供了更為完整的資源古掏∷鸹埃基于上述泛基因組研究結果,作者建立了一個網(wǎng)站槽唾,供世界各國小麥研究工作者利用丧枪,網(wǎng)址是:

http://appliedbioinformatics.com.au/cgi-bin/gb2/gbrowse/WheatPan/

好了,看了上面兩篇文獻的相關介紹庞萍,你是否對泛基因組有所了解呢拧烦?悄悄告訴你啊,小編發(fā)現(xiàn)泛基因組相關的文獻影響因子大都在10分以上呢钝计。所以恋博,如果苦于沒有什么好的研究思路,所研究的物種比較重要葵蒂,手頭上的種質資源又比較多交播,那不妨就做個泛基因組吧重虑。

參考文獻:

  1. Tettelin H, Masignani V, Cieslewicz M J, et al. Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: Implications for the microbial "pan-genome"[J]. Proc Natl Acad Sci U S A, 2005, 102(39):13950-13955.

  2. Li R, Li Y, Zheng H, et al. Building the sequence map of the human pan-genome[J]. Nature Biotechnology, 2010, 28(1):57-63.

  3. Zhao Q, Feng Q, Lu H, et al. Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice[J]. Nature Genetics, 2018, 50(2):278.

  4. Li Y H, Zhou G, Ma J, et al. De novo assembly of soybean wild relatives for pan-genome analysis of dis.[J]. Nature Biotechnology, 2014, 32(10):1045-1052.

  5. Yao W, Li G, Zhao H, et al. Exploring the rice dispensable genome using a metagenome-like assembly strategy.[J]. Genome Biology, 2015, 16(1):187.

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末践付,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子缺厉,更是在濱河造成了極大的恐慌永高,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件提针,死亡現(xiàn)場離奇詭異命爬,居然都是意外死亡,警方通過查閱死者的電腦和手機辐脖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門饲宛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人嗜价,你說我怎么就攤上這事艇抠∧宦” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵家淤,是天一觀的道長异剥。 經(jīng)常有香客問我,道長絮重,這世上最難降的妖魔是什么冤寿? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮青伤,結果婚禮上督怜,老公的妹妹穿的比我還像新娘。我一直安慰自己狠角,他們只是感情好亮蛔,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著擎厢,像睡著了一般究流。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上动遭,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天芬探,我揣著相機與錄音,去河邊找鬼厘惦。 笑死偷仿,一個胖子當著我的面吹牛,可吹牛的內容都是我干的宵蕉。 我是一名探鬼主播酝静,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼羡玛!你這毒婦竟也來了别智?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤稼稿,失蹤者是張志新(化名)和其女友劉穎薄榛,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體让歼,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡敞恋,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了谋右。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片硬猫。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出啸蜜,到底是詐尸還是另有隱情馏予,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布盔性,位于F島的核電站霞丧,受9級特大地震影響,放射性物質發(fā)生泄漏冕香。R本人自食惡果不足惜蛹尝,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望悉尾。 院中可真熱鬧突那,春花似錦、人聲如沸构眯。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽惫霸。三九已至猫缭,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間壹店,已是汗流浹背猜丹。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留硅卢,地道東北人射窒。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像将塑,于是被迫代替她去往敵國和親脉顿。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內容

  • 我將過去一年的所有推送做了一個匯總点寥,并大致分成了幾類“保現(xiàn)在回過頭來一看,這算是一份很寶貴的材料开财,特別是對剛剛入學的...
    Neal_Bio閱讀 2,621評論 0 10
  • 什么是泛基因組汉柒? 2005年,Tettelin等人提出了微生物泛基因組概念(pangenome责鳍,pan源自希臘語‘...
    lakeseafly閱讀 4,559評論 0 10
  • 一大早历葛,我掐準了時間,給單位的C總打了電話,“C總恤溶,您好乓诽,現(xiàn)在方便嗎?我可以過去嗎咒程?”“我在辦公室呢鸠天,你來吧!”于...
    快樂糊涂蟲閱讀 999評論 0 0
  • 事情的起源來自于我弟想出去玩帐姻,那我當然也是很想玩啊稠集。然而,我思想保守的父上母上一直認為年滿除夕饥瓷,就該呆在家里剥纷,年后...
    LuCky0_0閱讀 225評論 0 1
  • 倩倩: 展信安。 這個季節(jié)里呢铆,所有的惴惴不安都塵埃落定晦鞋。 假如生活欺騙了你,不要悲傷棺克,不要心急悠垛。...
    張十三喵閱讀 198評論 0 5