前言:
最近在浙大學(xué)習(xí),張老師分享給我近期Cell文章公布的南極磷蝦的基因組最新研究慨飘,讓我組會上講一下译荞,那就精讀一下吞歼,看一下(想起導(dǎo)師前段時間分享給我的那篇Cell文章還沒有仔細(xì)看呢,下次再解讀一下那篇文章)稽坤。
研究背景:
南極磷蝦尿褪,生活在南極比較寒冷的海域茫多,南極磷蝦的眼柄基部、頭部和胸的兩側(cè)及腹部的下面長有球形發(fā)光器夺欲,在外界的刺激下些阅,可以像螢火蟲一樣發(fā)出冷藍(lán)色的?磷光斑唬,這就是“磷蝦”名字的由來恕刘。南極磷蝦是南極地區(qū)的“?關(guān)鍵物種”褐着,南大洋磷蝦的蘊藏量為?4~6億噸,被稱為“?人類未來的蛋白資源倉庫”频敛。
研究結(jié)果:
Chromosome-level genome assembly and evaluation
研究人員共測了3.06Tb的 PacBio的CLR序列斟赚,734.99 Gb的HiFi-CCS序列差油,4.01 Tb短讀取和11.38 Tb Hi-C讀取蓄喇,詳見下表公罕。
組裝的基因組大小為48.01Gb,是目前報道組裝出的最大的動物基因組铲汪,Scaffold N50長度為1.08Gb, 66.01%的contigs錨定到17條染色體上掌腰,未錨定到染色體上contig長度短且基因分布密度非常低(Figure S1A, Table S1)齿梁。
重復(fù)序列勺择,尤其是短的長度相同的重復(fù)序列能夠快速的擴張基因組,無脊椎動物基因組常有大量的串聯(lián)重復(fù)(TRs)稿辙,導(dǎo)致它們基因組較難組裝邻储。南極磷蝦大量的DNA重復(fù)序列使其非常難組裝旧噪,最常見的衛(wèi)星重復(fù)序列長度比最近源的無脊椎動物基因組都長淘钟,Procambarus virginalis(美洲龍紋鰲蝦)和Litopenaeus vannamei(南美白對蝦)(Fig1 C,Table S2)日月。研究人員發(fā)現(xiàn)其組裝的基因組中含有很大比例的TRs(25.77%)缤骨,這仍然被低估绊起,因為TRs很難組裝,特別是對于單位長度長(>50堿基對[bp])和高豐度高TRs(Fig1 C,Table S2)蜂绎。南極磷蝦基因組具有比墨西哥蠑螈师枣、肺魚和兩種甲殼綱動物更高的重復(fù)區(qū)域密度(Fig1 D)践美。此外,還發(fā)現(xiàn)93.43%的contig序列尾部為重復(fù)序列敛滋,且臨近TEs具有高度相似性的重復(fù)序列绎晃,形成了額外的重復(fù)序列的延伸杂曲。
Fig1A 南極磷蝦基因組和重復(fù)序列
(B)154種無脊椎動物基因組大小和contig N50;(C)比較南極磷蝦解阅、L. vannamei(南美白對蝦)货抄、P. virginalis(美洲龍紋鰲蝦)基因組中51-249bp 長度的 TRs;(D)10kb 為單位長度計算基因組上重復(fù)原件分布蟹地;(E)無脊椎動物和脊椎動物重復(fù)序列組成比較怪与,灰色線表示這些物種重復(fù)序列平均值;(F) 南極磷蝦遍愿、L. vannamei沼填、P. virginalis的DNA/CMC-EnSpm TE超家族系統(tǒng)發(fā)育樹括授。
Attributes of a giant invertebrate genome
南極磷蝦巨大的基因組來源自其重復(fù)序列的擴張荚虚,其重復(fù)序列比例達(dá)到了92.25%(Fig 1E版述,Tables S2)。轉(zhuǎn)座原件(TEs)占了基因組的78.22%腊徙,值得注意的是撬腾,DNA/CMC-EnSpm占了重復(fù)序列的91.91%,占了全部基因組的42.02%胰默。與P. virginalis(美洲龍紋鰲蝦)和L.vannamei一起做DNA/CMC-EnSpm做系統(tǒng)發(fā)育分析顯示牵署,南極磷蝦并沒有顯示出特殊的聚類奴迅。
南極磷蝦共注釋出28,834個蛋白編碼基因挺据,因為重復(fù)序列擴張插入基因區(qū)域扁耐,其基因和內(nèi)含子長度要顯著比肺魚和墨西哥鈍口螈短婉称,然而王暗,相比于其它46種海洋無脊椎動物悔据,TE插入顯著的增加了南極磷蝦的內(nèi)含子長度(Fig 2A和 S1F)。
Dynamics of repetitive sequence expansion and its genetic mechanisms
南極磷蝦基因組GC含量為29.36%俗壹,低于90.91%(140/154)已發(fā)表的無脊椎動物基因組科汗,這種低GC含量顯示出基因組中大量的GC-poor DNA轉(zhuǎn)座子(Fig 2B)。有爭論顯示CpG二核苷酸丟失因為TEs引起的基因組擴張策肝。研究人員注意到南極磷蝦中兩個可能的TEs擴張事件分別發(fā)生在~36和~170 mya(Fig 2C)肛捍。最近發(fā)生的事件貢獻(xiàn)了39.51%的基因組擴張隐绵,與磷蝦屬磷蝦出現(xiàn)的時間接近之众,而另一次擴張事件貢獻(xiàn)了18.54%(Fig 2C)依许。
宿主基因組中TEs累積水平來自長時間進化過程中TE的活躍與抑制的相互作用棺禾。研究人員通過Pfam蛋白家族結(jié)構(gòu)域數(shù)據(jù)庫對南極磷蝦基因組蛋白序列進行注釋,注釋到的55.91%的結(jié)構(gòu)域來自top 20 的蛋白結(jié)構(gòu)域峭跳,其中11個與轉(zhuǎn)座子(TE)活性有關(guān)(Fig 2D),比如RVT_1和integrase (integrase_H2C2)膘婶。20個結(jié)構(gòu)域中缺前,由三個結(jié)構(gòu)域(zf-H2C2_2, zf-TRM13_CCCH, and zf-MYND)的密度高于其它46種非脊椎動物(Fig 2D),并推測這三種結(jié)構(gòu)域和南極磷蝦基因組擴增有關(guān)。
Fig 2. 大量重復(fù)序列對南極磷蝦基因組的影響
(A) 一個具有大量重復(fù)序列內(nèi)含子的南極磷蝦基因(MTHL1)的例子悬襟。通過對齊PacBio CCS讀取顯示該區(qū)域沒有裝配錯誤衅码;(B) 每個亞型重復(fù)序列和基因的GC含量和基因組比例的直方圖。直方圖柱高表示GC含量脊岳,折線表示基因組比例逝段,虛線表示全基因組平均GC含量、DNA轉(zhuǎn)座子(DNA)割捅、長點綴核元件(line)奶躯、長末端重復(fù)序列(LTR)、短點綴核元件(sin)亿驾、串聯(lián)重復(fù)序列(TR)嘹黔;(C) 轉(zhuǎn)座元件(TEs)在南極磷蝦體內(nèi)的插入時間,從左到右的垂直虛線表示TEs的兩個爆發(fā)峰和的發(fā)散時間分別是南極磷蝦莫瞬。每種轉(zhuǎn)座子的百分比分別計算儡蔓。RC表示滾圈重復(fù);(D) 南極磷蝦基因組中分布數(shù)量和密度top20的domains乏悄,圖頂部的粗體線表示結(jié)構(gòu)域的數(shù)量浙值,圖底部的箱線圖表示47個無脊椎動物基因組結(jié)構(gòu)域密度的分布。結(jié)構(gòu)域密度計算為domains數(shù)除以基因組大小檩小,Z分?jǐn)?shù)歸一化开呐。南極磷蝦的區(qū)域密度以紅色倒三角突出顯示。
The genomic basis of environmental adaptations of Antarctic krill
南極磷蝦之所以能夠在南大洋保持大量的數(shù)量规求,是因為它們進化出了季節(jié)性同步策略筐付,使它能夠適應(yīng)不同的光照、溫度和浮冰水平阻肿。南極磷蝦暴露在寒冷的環(huán)境中瓦戚,季節(jié)變化引起了劇烈的光線變化,并進化出了晝夜節(jié)律的遺傳適應(yīng)性丛塌。南極磷蝦可能和其它真核生物一樣较解,轉(zhuǎn)錄因子CLOCK (CLK)和CYCLE (CYC)結(jié)合編碼其抑制劑的基因上游的E-box元件,產(chǎn)生了自我維持的晝夜節(jié)律赴邻。其基因組中發(fā)現(xiàn)了625個基因組包含至少一個E-box原件印衔,包含了一些主要的生物鐘抑制體PER, TIM和CRY2,三種關(guān)鍵的晝夜節(jié)律轉(zhuǎn)錄因子能夠直接調(diào)節(jié)CLK和CYC表達(dá)姥敛。研究人員的發(fā)現(xiàn)提供了磷蝦生物鐘分子結(jié)構(gòu)的模型(Fig 3A)奸焙,證實了雙重反饋回路機制存在的可能。進一步評估了生物節(jié)律反饋回路中基因表達(dá)的季節(jié)差異,揭示了四個晝夜節(jié)律基因(CLK与帆、CRY1了赌、NEMO和PDP1)在夏季和冬季的表達(dá)差異,CLK玄糟、CRY1和PDP1在夏季上調(diào)勿她,而NEMO在冬季上調(diào)(Fig 3A)。南極磷蝦基因組中有25個基因家族顯著擴張(Fig 3B)阵翎。12個直接參與蛻皮周期(6個基因組家族)和能量代謝(6個基因家族)(Fig 3C)嫂拴,這些基因家族中的大部分基因是可以表達(dá)的(Fig 3D)。
甲殼素是甲殼類動物角質(zhì)層的基本組成部分贮喧。南極磷蝦中幾丁質(zhì)結(jié)合蛋白的編碼基因發(fā)生了擴增(Fig 3E) 可能于其在蛻皮周期中精細(xì)調(diào)節(jié)角質(zhì)層的形成和吸收有關(guān)筒狠。6個基因擴增的家族和能量代謝相關(guān)(Fig 3C)。一些和能量代謝相關(guān)的基因CYSC,PFK, and PKLR在夏天時高表達(dá) (Fig 3F)箱沦, 可能促進了卵黃的生成和蛻皮過程辩恼。消化脂肪酶基因PNLIPRP2的兩個同源物之一在冬季高表達(dá),可能有助于其在食物短缺的情況下生存(Fig 3F)谓形。此外灶伊,促進脫殼和生長的基因(JHE、JHE-like CXE和CHT10)在夏季食物可得性高時上調(diào)寒跳,而抑制脫殼的基因(JHAMT和CASP2)在冬季上調(diào)(Fig 3F)聘萨。
Fig 3. 候選基因組變化是適應(yīng)南極海洋環(huán)境的基礎(chǔ)
(A) 南極磷蝦雙重反饋回路機制。粉紅色陰影基因(CRY1, CLK, PDP1和NEMO)在夏季和冬季表達(dá)差異顯著童太。而其他被黃色遮蔽的基因在夏季和冬季沒有表達(dá)差異米辐。E-box表示在受轉(zhuǎn)錄因子調(diào)控的時鐘控制基因上游發(fā)現(xiàn)的啟動子元件時鐘(CLK)和周期(CYC);(B) 12種無脊椎動物的缺失基因和增加基因家族的系統(tǒng)發(fā)育圖譜书释。藍(lán)色和紅色數(shù)字分別表示每個分支上獲得和丟失的基因家族的數(shù)量(包含顯著性和非顯著性基因家族)翘贮。散度時間估計(百萬年前,mya)顯示在每個節(jié)點上爆惧,紅色分支表示南極磷蝦狸页;(C) 南極磷蝦基因組中能量代謝相關(guān)的基因家族顯著擴張,每個基因家族中用氣泡大小表示的基因數(shù)量扯再。南極磷蝦每個基因家族基因數(shù)量和其它物種比較的平均FC值用upper histogram表示芍耘;
(D) 55個南極磷蝦樣本中12個表達(dá)顯著增高的基因家族基因;
(E) 12個物種中和蛻皮有關(guān)的基因組家族基因組OG0000000系統(tǒng)發(fā)育分析熄阻;
(F) 南極磷蝦在夏季和冬季差異表達(dá)的箱式圖斋竞。
Antarctic krill population dynamics
為了探究南極磷蝦是否為單一同質(zhì)遺傳群體,研究人員對南大洋4個區(qū)域的75個南極磷蝦個體進行了重測序饺律,平均測序深度為17.72 x(Fig 4A)窃页。獲得了364.57 百萬個SNPs,平均每37個bp就有一個SNP复濒。不同地區(qū)的南極磷蝦間遺傳指數(shù)最大值Fst為1.92*10-3(Fig 4B)脖卖,說明不同地區(qū)南極磷蝦種群無明顯的分化。使用66個個體巧颈,總計47.56萬個SNPs位點做 PCA分析畦木,不同地區(qū)磷蝦存在一定的遺傳差異,尤其是SG和PB-RS之間(Fig 4C)砸泛。isolation-by-environment (IBE)分析顯示遺傳差異顯著和遺傳距離相關(guān)(Fig 4D)十籍。此外,研究人員使用the latent factor mixed model檢測到了387個潛在的SNPs和不同環(huán)境適應(yīng)性相關(guān)唇礁。4組中387個自適應(yīng)snp的等位基因頻率表明SG- SSI組和PB-RS組之間存在明顯的遺傳差異(Fig 4E)勾栗。這些結(jié)果表明,環(huán)境選擇可能在不同南極磷蝦類群的遺傳結(jié)構(gòu)中發(fā)揮重要作用
為了揭示南極磷蝦的歷史上的種群大小盏筐,采用了pairwise sequentially Markovian coalescent (PSMC)方法和PopSizeABC推斷過去的有效種群大小(estimate past effective population sizes,Ne)围俘。發(fā)現(xiàn)Ne在10 mya 前發(fā)生了急劇的減少(Fig 4F),和更新世時期南大洋溫度整體降低時期一致,在100 千年前琢融,種群又持續(xù)的擴張(Fig 4F)界牡。
Fig4 南極磷蝦種群變化
(A)四個地區(qū),PB,RS,SSI,SG收集了南極磷蝦樣本進行重測序螟左;(B)不通地區(qū)南極磷蝦的遺傳差異(Fst值比較)袜匿;(C)66個個體携取,47,555,257個SNPs的PCA分析;(D)IBE分析,隨著地理距離的增加挽荠,南極磷蝦的遺傳差異增大;(E)387個適應(yīng)性SNPs等位基因在頻率分布平绩,PB/RS和SSI/SG間等位基因組頻率分布差異坤按;(F)估算南極磷歷史蝦種群大小。兩年時間作為一代時間(9),突變率為每一代1.6*10-10 馒过。藍(lán)線代表地表溫度臭脓,紅線代表相對海平面。淺藍(lán)色陰影表示南極磷蝦種群瓶頸期后的擴張期腹忽。
總結(jié):
磷蝦基因組太大了来累,組裝起來肯定非常費勁,對服務(wù)器的要求肯定很高窘奏,得耗費非常多的人力資源嘹锁,材料方法部分對于我這種處在學(xué)習(xí)階段的人來說,要比內(nèi)容更有價值的多着裹,十八般武器全上來秀了一遍,很多分析內(nèi)容可以借鑒一下领猾。??
補充學(xué)習(xí):
Fst:群體間遺傳分化指數(shù),是種群分化和遺傳距離的一種衡量方法,分化指數(shù)越大摔竿,差異越大面粮。適用于亞群體間多樣性的比較。Fst值的取值范圍是【0,1】继低,最大值為1表明兩個群體完全分化熬苍,最小值為0表明群體間無分化。在實際的研究中Fst值為0--0.05時說明群體間遺傳分化很小袁翁,可以不做考慮柴底;
為0.05--0.15時,表明群體間存在中等程度的遺傳分化粱胜;
為0.15--0.25時群體間存在較大的遺傳分化柄驻;
為0.25以上的時候群體間就存在很大的遺傳分化了。
isolation-by-distance (IBD) test:距離隔離
本文使用 文章同步助手 同步