NGS基礎(chǔ)概念

來源自:華大科技知識庫

組學

研究細胞连锯、組織或是整個生物體內(nèi)某種分子(DNA住拭、RNA净蚤、蛋白質(zhì)盆繁、代謝物或其他分子)的所有組成內(nèi)容盯孙,稱之為“組學”(-omics)调卑,”-omics”術(shù)語代表了對怎樣思考生物學和生物體系工作方式的重新定位莉兰。組學研究包括對基因組及基因產(chǎn)物(轉(zhuǎn)錄子組和蛋白質(zhì)組)的系統(tǒng)生物學研究聊训,隨后必然要上升到細胞機制秦效、分子機制和系統(tǒng)生物學的水平雏蛮。

基因組學相關(guān)概念

基因組即指生物所具有的攜帶遺傳信息的遺傳物質(zhì)的總和,包括所有的基因和基因間區(qū)域阱州√舯基因組的結(jié)構(gòu)主要指核酸分子中不同的基因功能區(qū)域各自的分布和排列情況,其功能是儲存及表達遺傳信息苔货。不同種類生物儲存的遺傳信息量迥異衷模,其基因組的結(jié)構(gòu)和組織形式也不同。
三類:結(jié)構(gòu)基因組學蒲赂、功能基因組學和比較基因組學阱冶。

真核生物基因組有三種類型

1.核基因組:細胞核內(nèi)所有遺傳物質(zhì)的總和;
2.線粒體基因組:線粒體攜帶遺傳物質(zhì)的總和滥嘴;
3.葉綠體基因組:葉綠體攜帶遺傳物質(zhì)的總和木蹬。

轉(zhuǎn)錄組學相關(guān)概念

1.轉(zhuǎn)錄本
亦稱剪切體,通常為一個基因通過轉(zhuǎn)錄剪接形成一種或多種可供編碼蛋白質(zhì)的成熟的mRNA若皱。
2.轉(zhuǎn)錄因子
能與基因前端5’端上游特定序列專一性結(jié)合镊叁,從而保證目的基因以特定的強度在特定的時間與空間表達的蛋白質(zhì)分子。根據(jù)轉(zhuǎn)錄因子的作用特點可分為二類:第一類為普遍轉(zhuǎn)錄因子,它們與RNA聚合酶Ⅱ共同組成轉(zhuǎn)錄起始復合體時走触,轉(zhuǎn)錄才能在正確的位置開始晦譬;第二類轉(zhuǎn)錄因子為組織細胞特異性轉(zhuǎn)錄因子,這些TF是在特異的組織細胞或是受到一些類固醇激素\生長因子或其它刺激后互广,開始表達某些特異蛋白質(zhì)分子時敛腌,才需要的一類轉(zhuǎn)錄因子卧土。
3.轉(zhuǎn)錄組測序
通過高通量測序研究特定組織或細胞在某個時期轉(zhuǎn)錄出來的mRNA的表達量,進而對相關(guān)基因和表型的關(guān)系進行分析像樊。本質(zhì)上講轉(zhuǎn)錄組測序就是在用一種新的方法實現(xiàn)“基因決定性狀”的經(jīng)典思路尤莺。
在有參考序列的前提下,基于是否做結(jié)構(gòu)分析生棍,又劃分出只做定量的RNA-seq颤霎,也就是度mRNA進行表達量測定和差異表達基因分析等。
在有參考序列的前提下涂滴,基于是否做結(jié)構(gòu)分析友酱,又劃分出只做定量的RNA-seq,也就是度mRNA進行表達量測定和差異表達基因分析等柔纵。
需要注意粹污,建庫至少兩次生物學重復,3次以上的生物學重復更好首量。以3個重復為例壮吩,加上對照的三個生物學重復,一次RNA-seq需要6個樣本加缘。

蛋白質(zhì)組學相關(guān)概念

蛋白的主要生物學功能
 1)作為生物催化劑
 2)代謝調(diào)節(jié)作用
 3)免疫保護作用
 4)物質(zhì)的轉(zhuǎn)運和存儲
 5)運動與支持作用
 6)參與細胞間信息傳遞
蛋白質(zhì)組數(shù)據(jù)庫
(https://www.ebi.ac.uk/)
1鸭叙、UniProtKB
其中85%的記錄來自于公共核苷酸數(shù)據(jù)庫(如ENA/GenBank/DDBJ等)提交的蛋白質(zhì)編碼序列,這些序列會經(jīng)過UniprotKB的工作人員手動整合添加拣宏。該數(shù)據(jù)庫可以用于驗證蛋白質(zhì)的結(jié)構(gòu)功能沈贝,查找蛋白質(zhì)在細胞內(nèi)的定位等等,當然最基礎(chǔ)的同源序列比對是必備功能勋乾。
2宋下、PRIDE 官網(wǎng)
PRIDE是一系列PRoteomics IDEntifications的數(shù)據(jù)庫。主要包含蛋白質(zhì)和多肽(另有轉(zhuǎn)錄后修飾信息)的記錄信息辑莫,同時包含支持這些記錄的質(zhì)譜信息学歧。簡而言之就是一個質(zhì)譜數(shù)據(jù)庫,每個蛋白質(zhì)都附有試驗方法的描述各吨,pubmed ID枝笨。

代謝組學相關(guān)概念。

**代謝組學(metabonomics/metabolomics)是效仿基因組學和蛋白質(zhì)組學的研究思想揭蜒,對生物體內(nèi)所有代謝物進行定量分析横浑,并尋找代謝物與生理病理變化的相對關(guān)系的研究方式,是系統(tǒng)生物學的組成部分屉更。研究對象是生物體內(nèi)相對分子質(zhì)量1000Da以內(nèi)的小分子代謝物徙融。先進分析檢測技術(shù)結(jié)合模式識別和專家系統(tǒng)等計算分析方法是代謝組學研究的基本方法。

代謝組學相關(guān)數(shù)據(jù)庫

常用的代謝組學相關(guān)數(shù)據(jù)庫有人類代謝組數(shù)據(jù)庫(Human Metabolome Database瑰谜, HMDB)欺冀、KEGG數(shù)據(jù)庫树绩、Reactome數(shù)據(jù)庫 (http://www.reactome.org)等:
(1)人類代謝組數(shù)據(jù)庫(HMDB)是代謝組學熱門數(shù)據(jù)庫之一,包含人體內(nèi)發(fā)現(xiàn)的小分子代謝物的詳細信息脚猾,包含不少于79,650種代謝物條目砚哗。
(2)SMPDB數(shù)據(jù)庫與HMDB關(guān)聯(lián)龙助,包含約700種人類代謝和疾病途徑的途徑圖。
(3)KEGG數(shù)據(jù)庫是代謝組熱門數(shù)據(jù)庫之一蛛芥,包含代謝通路和互作網(wǎng)絡信息提鸟。
(4)Reactome數(shù)據(jù)庫主要收集了人體主要代謝通路信息以及重要反應。
(5)MassBank數(shù)據(jù)庫主要收集許多高分辨率低代謝組分的譜圖仅淑。
(6)BioCyc數(shù)據(jù)庫包含通路和基因組數(shù)據(jù)称勋。
(7)METLIN數(shù)據(jù)庫,是商業(yè)化的代謝組及串聯(lián)質(zhì)譜數(shù)據(jù)庫涯竟,包含有約43000種代謝物和22000個MS/MS譜圖赡鲜。
(8)FiehnLib數(shù)據(jù)庫是商業(yè)化的代謝組數(shù)據(jù)庫,包含約1000個保守的代謝分子的EI光譜庐船。
NIST/EPA/NIH Mass Spectral Library數(shù)據(jù)庫也是商業(yè)化的代謝組數(shù)據(jù)庫银酬,包含超過190,000 個EI譜圖筐钟。
(9)BioCyc數(shù)據(jù)庫收集了通路和基因組數(shù)據(jù)揩瞪,可以免費使用。
(10)MetaCyc數(shù)據(jù)庫廣泛收集了許多來自不同生物體的代謝通路以及酶的信息篓冲,囊括了超過51000篇文獻李破。
(11)MMCD數(shù)據(jù)庫收集有超過10000種代謝物的信息以及它們的質(zhì)譜和核磁共振譜數(shù)據(jù),大多數(shù)是擬南芥的代謝物壹将。

表觀基因組學相關(guān)概念

其研究內(nèi)容主要包括兩類嗤攻,一類為基因選擇性轉(zhuǎn)錄表達的調(diào)控,有DNA甲基化诽俯、基因印記屯曹、組蛋白共價修飾和染色質(zhì)重塑;另一類為基因轉(zhuǎn)錄后的調(diào)控惊畏,包括基因組中非編碼RNA恶耽、微小RNA、反義RNA颜启、內(nèi)含子及核糖開關(guān)等五類偷俭,分別是對表觀基因組和表觀基因組各狀態(tài)的影響的不同的方面進行測序的結(jié)果:

1、組蛋白修飾:

染色質(zhì)免疫沉淀測序(ChIP-Seq)使用抗各種組蛋白修飾變體的抗體缰盏,從而鑒定出全基因組組蛋白修飾類型涌萤。

2淹遵、DNA甲基化:

DNA甲基化的形成機制,包括從頭合成(de novo)负溪,甲基化的維持(Maintenance)和去甲基化(Demethylation)透揣,這些過程分別由不同的基因和通路調(diào)控。這些基因和通路在動植物中即保守川抡,又有所區(qū)別辐真。例如,在植物中就有一個特色通路——RNA介導的DNA甲基化(RdDM)崖堤。雖然侍咱,迄今為止DNA甲基精確調(diào)控的機制還依然沒有完全解開,但了解已知的基礎(chǔ)調(diào)控方式依然對我們的研究有很大幫助密幔。
DNA甲基化高通量檢測常見的高通量DNA甲基化檢測方法有MeDIP楔脯,RRBS,TBS和WGBS。隨著測序價格不斷下降胯甩,覆蓋度和精確度都最優(yōu)的WGBS相信會逐漸變成DNA甲基化研究的主流昧廷。


image

3、ATAC-seq

即可鑒定染色質(zhì)開放的區(qū)域偎箫, ATAC-seq全稱Assay for Transposase Accessible Chromatin with high-throughput sequencing麸粮,即利用轉(zhuǎn)座酶研究染色質(zhì)可進入性的一種新型高通量測序技術(shù)。也就是說ATAC能幫助你從全基因組范圍內(nèi)推測可能的轉(zhuǎn)錄因子镜廉,還能通過比較不同時間的染色質(zhì)開放區(qū)域解答發(fā)育問題弄诲。

甲基化基本介紹

DNA甲基化是最早發(fā)現(xiàn)的基因表觀修飾方式之一,在維持染 色體結(jié)構(gòu)娇唯、X染色體失活齐遵、基因印記和腫瘤的發(fā)生中起著重要的作用。了解DNA甲基化的機制和功能以及在不同組織或不同個體中的差異將對人類健康與疾病研究 產(chǎn)生深遠的影響塔插;基因組DNA甲基化作為一種重要的表觀遺傳修飾系統(tǒng)梗摇,在調(diào)控基因表達、細胞分化以及其它各種生命過程中起到了非常重要的作用想许。

CpG 島的發(fā)現(xiàn)

CpG 島最早是由Tykocinski 和Max發(fā)現(xiàn)并定義的伶授。指包含限制性內(nèi)切酶HpaⅡ結(jié)合位點的小區(qū)域,因此也被稱為HpaⅡ小片段島流纹。由于上述定義包含了許多短的重復序列糜烹,Takai 和Jones將CpG 島進行了重新的定義: 長度不小于500 bp、GC 含量不小于55%漱凝、CpG 實際含量與期望含量之比不小于0.65疮蹦。

甲基化的發(fā)生過程

在脊椎動物中,CpG二核苷酸是DNA 甲基化發(fā)生的主要位點。CpG常成簇存在,人們將基因組中富含CpG的一段DNA 稱為CpG島(CpGisland) ,通常長度在1kb~2kb 左右茸炒。CpG島常位于轉(zhuǎn)錄調(diào)控區(qū)附近,DNA 甲基化的研究與CpG島的研究密不可分愕乎。在DNA 甲基化過程中,胞嘧啶突出于DNA 雙螺旋并進入與胞嘧啶甲基轉(zhuǎn)移酶結(jié)合部位的裂隙中,該酶將S - 腺苷甲硫氨酸(SAM) 的甲基轉(zhuǎn)移到胞嘧啶的5′位,形成5 - 甲基胞嘧啶(5 -methylcytosine ,5MC) 阵苇。


image
DNA去甲基化

DNA甲基化狀態(tài)并不是固定不變的。與甲基 化相似, 去甲基化也有兩種形式感论。一種是復制依賴 性的“被動去甲基”, 即通過阻止新生鏈上發(fā)生 DNA甲基化而達到去甲基的效果;另一種則是非復制 依賴性的“主動去甲基”绅项。這一方面目前已經(jīng)有 了很多相關(guān)研究, 在植物中的路徑機制已經(jīng)比較清楚, 通過 5- 甲基胞嘧啶糖苷酶和堿基去除修復路徑清除 多余胞嘧啶的甲基化。但是在動物中, 雖然已經(jīng)有各種證據(jù)證明了主動去甲基化的存在, 但是其作用機制仍然存在爭議比肄。

甲基化轉(zhuǎn)移酶

Dnmt1
Dnmt1 包含1573 個氨基酸快耿,其C 端為保守的催化甲基化反應結(jié)構(gòu)域;Dnmt1 主要是維持DNA 的持續(xù)甲基化狀態(tài)薪前,使DNA 分子中未甲基化的那一條子鏈甲基化润努,從而保持子鏈與親鏈有完全相同的甲基化形式关斜,因此Dnmt1 是一種維持甲基轉(zhuǎn)移酶示括。
Dnmt3
Dnmt3a 和Dnmt3b屬于重新甲基化酶,參與DNA 甲基化的從頭合成痢畜,即對沒有甲基化的DNA 鏈進行甲基化;Dnmt3L 是一種相關(guān)蛋白調(diào)節(jié)因子垛膝,本身不具有DNA 甲基化功能,但可調(diào)節(jié)Dnmt3a 和Dnmt3b的活性丁稀,其氨基酸序列與Dnmt3a 和Dnmt3b 極其相似吼拥,但在C 端區(qū)域缺少DNA 甲基化轉(zhuǎn)移酶活性所必需的相關(guān)物質(zhì)

甲基化的相關(guān)研究

不同物種DNA甲基化情況
1、哺乳動物:
CpG以兩種形式存在: 一種分散存在于DNA序列中线衫;另一種呈現(xiàn)高度聚集狀態(tài)凿可,即CpG島。在正常組織里授账,70% ~ 90% 分散存在的CpG是被甲基化修飾的枯跑,而CpG 島則是非甲基化的。正常情況下白热,人類基因組非CpG島序列的CpG二核苷酸相對稀少敛助,并且總是處于甲基化狀態(tài),與之相反屋确,人類基因組中大小為100~1000bp 左右纳击,富含CpG二核苷酸的CpG島則總是處于未甲基化狀態(tài),而CpG島常位于轉(zhuǎn)錄調(diào)控區(qū)附近攻臀,與56%的人類基因組編碼基因相關(guān)焕数,因此基因非轉(zhuǎn)錄區(qū)CpG島的甲基化狀態(tài)的研究就顯得十分重要。人類基因組序列草圖分析結(jié)果表明刨啸,人類基因組CpG 島約為28890個百匆,大部分染色體每1Mb 就有5~15個CpG島,平均每Mb含10.5 個CpG島呜投,并且CpG島的數(shù)目與基因密度有良好的對應關(guān)系加匈。
2存璃、在無脊椎動物中
DNA 甲基化主要發(fā)生于基因內(nèi)部,基因間區(qū)大部分未被甲基化雕拼,重復序列或轉(zhuǎn)座子區(qū)域的甲基化情況在昆蟲中幾乎不存在纵东。在無脊椎動物中,外顯子和內(nèi)含子的甲基化模式也表現(xiàn)出較大差異啥寇,如在牡蠣中偎球,外顯子和內(nèi)含子存在較高的甲基化水平,而在金小蜂中辑甜,內(nèi)含子的甲基化水平卻要顯著低于外顯子衰絮。
3、植物研究
從基因表達方面研究有利于解釋雜種優(yōu)勢的機理磷醋,可以利用甲基化手段分析親本與雜交種之間存在的表型差異猫牡。Tsaftaris等人對玉米雜交種和親本甲基化MSAP 分析表明,親本的甲基化程度明顯高于雜交種邓线,由此認為雜種優(yōu)勢可能與DNA 甲基化程度降低有關(guān)淌友。DNA 甲基化還可以解釋作物之間的表型獨立特性『С拢基因組DNA 被甲基化修飾后震庭,影響其對環(huán)境的脅迫應答。由于植物的分生組織產(chǎn)生生殖細胞你雌,所以在形成分生組織前的表觀遺傳可直接傳遞給后代器联。非生物的逆境脅迫,如鹽婿崭,干旱拨拓,熱,抗生素等逛球,都會引起甲基化水平的改變千元。

宏基因組學相關(guān)概念

宏基因組 ( Metagenome)是由Handelsman等1998年提出的新名詞, 其定義為“the genomes of the total microbiota found in nature” , 即生境中全部微小生物遺傳物質(zhì)的總和。它包含了可培養(yǎng)的和未可培養(yǎng)的微生物的基因, 目前主要指環(huán)境樣品中的細菌和真菌的基因組總和颤绕。
宏基因組學 (或元基因組學, metagenomics) 就是一種以環(huán)境樣品中的微生群物體基因組為研究對象, 以功能基因篩選和/或測序分析為研究手段, 以微生物多樣性幸海、 種群結(jié)構(gòu)、 進化關(guān)系奥务、 功能活性物独、 相互協(xié)作關(guān)系及與環(huán)境之間的關(guān)系為研究目的的新的微生物研究方法。
人類微生物組計劃是人類基因組計劃的延伸氯葬,它研究的重點是通過宏基因組學的方法研究人體內(nèi)(表)的微生物菌群結(jié)構(gòu)變化與人體健康的關(guān)系挡篓。
人體內(nèi)有兩個基因組,一個是從父母那里遺傳來的人基因組,編碼大約2.5萬個基因官研;另一個則是出生以后才進入人體秽澳、特別是腸道內(nèi)的多達1000多種的共生微生物,其遺傳信息的總和叫“微生物組”戏羽,也可稱為“元基因組”担神,它們所編碼的基因有100萬個以上。兩個基因組相互協(xié)調(diào)始花、和諧一致妄讯,保證了人體的健康。因此酷宵,在研究基因與人體健康關(guān)系時亥贸,一定不能忽略共生微生物基因的研究。

微生物測序與檢測

(1)目前浇垦,我國的微生物檢測主要用于腸道細菌的檢測炕置,未來勢必會延伸到黏膜粘附細菌(口腔、呼吸道等)溜族,全生態(tài)微生物檢測是微生物檢測的最終目標讹俊。
(2)大量的公司會以16S rRNA基因(細菌的系統(tǒng)分類研究中最有用的和最常用的分子鐘)測序入手垦沉。近幾年煌抒,宏基因組測序技術(shù)逐步興起,相較于16S rRNA基因厕倍,宏基因組可以提供更多更準確的信息寡壮,用于分析菌群與環(huán)境及菌群與宿主穩(wěn)態(tài)。宏基因組測序技術(shù)會逐步成為微生物檢測產(chǎn)業(yè)的核心技術(shù)讹弯。
(3)隨著測序樣本數(shù)量越來越多况既,會產(chǎn)生大量的數(shù)據(jù)。微生物數(shù)據(jù)庫的建立與分析勢必會成為微生物檢測產(chǎn)業(yè)閉環(huán)中最為重要的環(huán)節(jié)之一组民。經(jīng)過清洗棒仍、分析的數(shù)據(jù)可以提供用于疾病診斷、檢驗的數(shù)據(jù)基礎(chǔ)臭胜,用藥指導建議莫其,保健品及藥品研發(fā)等更多領(lǐng)域。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末耸三,一起剝皮案震驚了整個濱河市乱陡,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌仪壮,老刑警劉巖憨颠,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異积锅,居然都是意外死亡爽彤,警方通過查閱死者的電腦和手機养盗,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來适篙,“玉大人爪瓜,你說我怎么就攤上這事〕妆瘢” “怎么了铆铆?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長丹喻。 經(jīng)常有香客問我薄货,道長,這世上最難降的妖魔是什么碍论? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任谅猾,我火速辦了婚禮,結(jié)果婚禮上鳍悠,老公的妹妹穿的比我還像新娘税娜。我一直安慰自己,他們只是感情好藏研,可當我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布敬矩。 她就那樣靜靜地躺著,像睡著了一般蠢挡。 火紅的嫁衣襯著肌膚如雪弧岳。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天业踏,我揣著相機與錄音禽炬,去河邊找鬼。 笑死勤家,一個胖子當著我的面吹牛腹尖,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播伐脖,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼热幔,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了晓殊?” 一聲冷哼從身側(cè)響起断凶,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎巫俺,沒想到半個月后认烁,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年却嗡,在試婚紗的時候發(fā)現(xiàn)自己被綠了舶沛。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡窗价,死狀恐怖如庭,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情撼港,我是刑警寧澤坪它,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站帝牡,受9級特大地震影響往毡,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜靶溜,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一开瞭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧罩息,春花似錦嗤详、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至崭别,卻和暖如春冬筒,著一層夾襖步出監(jiān)牢的瞬間恐锣,已是汗流浹背茅主。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留土榴,地道東北人诀姚。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像玷禽,于是被迫代替她去往敵國和親赫段。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內(nèi)容