思維導圖
推薦學習視頻:陳巍學基因
測序的過程和原理
使用fastqc進行質(zhì)量分析
測序發(fā)展歷史
測序的類型
一代測序 sanger法
二代測序Illumina
邊合成邊測序(sequence by synthesis, SBS):用不同顏色的熒光標記四種不同的dNTP,當DNA聚合酶合成互補鏈時次伶,每添加一種dNTP就會釋放出不同的熒光篙议,根據(jù)捕捉的熒光信號并經(jīng)過特定的計算機軟件處理览祖,從而獲得待測DNA的序列信息蜡感。
過程:DNA文庫構(gòu)建礁遣,簇的生成——橋式PCR了嚎,測序萎津,數(shù)據(jù)產(chǎn)出
三代測序:Pacific Biosciences公司的SMRT技術(shù)和Oxford Nanopore Technologies公司的納米孔單分子技術(shù)
單分子實時DNA測序。DNA測序時递宅,不需要經(jīng)過PCR擴增娘香,實現(xiàn)了對每一條DNA分子的單獨測序
測序數(shù)據(jù)的格式
Fastq格式:
一種基于文本的,保存生物序列(通常是核酸序列)和其測序質(zhì)量信息的標準格式,一般都包含有4行办龄。
第一行:由‘@’開始烘绽,后面跟著序列ID和可選的描述,序列ID是唯一的俐填;
第二行:堿基序列安接;
第三行:由‘+’開始,后面是序列的描述信息英融;
第四行:第二行序列的質(zhì)量評價(quality value)盏檐。
Fasta格式:
1:以“>”為開頭,fasta格式標志驶悟。
2:序列ID號胡野,gi號,NCBI數(shù)據(jù)庫的標識符痕鳍,具有唯一性硫豆。
格式為:gi|gi號|來源標志|序列標志(接收號、名稱等)额获,若某項缺失可以留空够庙,“|”保留恭应。
3:序列描述抄邀。
4:堿基序列,序列中允許空格昼榛、換行境肾、空行剔难,一般一行60個。
一些名詞
1.基因組學(核酸序列分析)
(1)全基因組測序(WGS)
(2)全外顯子組測序(WES)
(3)簡化基因組測序(RRGS)
①RAD-Seq
②GBS
③2bRAD
④ddGBS(也就是ddRAD)
作用:
(1)基因組作圖(遺傳圖譜奥喻、物理圖譜偶宫、轉(zhuǎn)錄本圖譜)
(2)核苷酸序列分析
(3)基因定位
(4)基因功能分析
其它:
以全基因組測序為目標的結(jié)構(gòu)基因組學
以基因功能鑒定為目標的功能基因組學
2.轉(zhuǎn)錄組學(基因表達分析)
1)mRNA-Seq
(2)IncRNA-Seq(長鏈非編碼RNA)
(3)sRNA-Seq(主要是miRNA-Seq)
作用:
(1)獲得物種或者組織的轉(zhuǎn)錄本信息
(2)得到轉(zhuǎn)錄本上基因的相關(guān)信息,如基因結(jié)構(gòu)功能等
(3)發(fā)現(xiàn)新的基因
(4)基因結(jié)構(gòu)優(yōu)化
(5)發(fā)現(xiàn)可變剪切
(6)發(fā)現(xiàn)基因融合
(7)基因表達差異分析
3.蛋白質(zhì)組學
(1)蛋白質(zhì)組數(shù)據(jù)處理环鲤、蛋白及其修飾鑒定
(2)構(gòu)建蛋白質(zhì)數(shù)據(jù)庫纯趋、相關(guān)軟件的開發(fā)和應用
(3)蛋白質(zhì)結(jié)構(gòu)功能預測
(4)蛋白質(zhì)連鎖圖
4.代謝組學
(1)代謝物指紋分析
(2)代謝輪廓分析