當進行轉(zhuǎn)錄組學數(shù)據(jù)分析時同规,會發(fā)現(xiàn)有兩種數(shù)據(jù)债热。一種被稱為芯片數(shù)據(jù)(Microarray data),另一種是下一代測序技術(shù)(NGS)得到的數(shù)據(jù)(eg挑围,二代測序倔喂,三代測序)铝条。
目錄
1. Microarray: 芯片數(shù)據(jù)
2. NGS (Next Generation Sequencing)
3. RNA-Seq的應用
1. Microarray: 芯片數(shù)據(jù)
原理:基于分子雜交技術(shù),主要是依靠印刷有熒光標記探針的基因芯片來實現(xiàn)席噩。比如說基因組芯片班缰,它高密度的集成了分辨率高達幾bp~100bp的探針,通過與樣品雜交熒光顯色的辦法來刻畫轉(zhuǎn)錄組的信息悼枢。
- 流程:1.標記mRNA或cDNA文庫埠忘,2.與設(shè)計好的探針相雜交,3.洗脫萧芙,與探針有特異性結(jié)合的cDNA就保留了下來给梅,4成像系統(tǒng)拍照捕捉信息;
- 原始數(shù)據(jù):由儀器對雜交結(jié)果照像生成的圖片双揪,保存格式為CEL格式动羽;
- 參考數(shù)據(jù):基因芯片探針排布的信息,保存為CDF格式渔期;
- 優(yōu)點:高度集成运吓,易于應用,成本低
- 缺點:
1. 高度地依賴已知信息疯趟;
2. 高背景噪音拘哨,非特異雜交會帶來的無法分辨弱信號和信號過飽和的問題;
3. 在不同樣品的比較當中信峻,甚至在同一芯片內(nèi)部倦青,都存在雜交不均勻帶來的各種問題,需要標準化等統(tǒng)計學方法來對結(jié)果校正盹舞;
4. 不能對可變剪接進行分析
2. NGS (Next Generation Sequencing)
直接對cDNA進行測序产镐。下一代測序(Next Generation Sequencing隘庄,NGS)又名高通量測序(High-Throughput Sequencing),是相對于傳統(tǒng)的桑格測序(Sanger Sequencing)而言的癣亚。
- 有參考基因組的測序流程:
- 從樣品分離出mRNA丑掺;
- 反轉(zhuǎn)錄成cDNA, 片段化建庫;
- 對文庫進行測序述雾;
- mapping到參考基因組上街州;
- 無參考基因組測序:要對測序結(jié)果進行拼接
- 高通量測序的主要平臺代表有
- 羅氏公司(Roche)的454測序儀(Roch GS FLX sequencer)
- Illumina公司的Solexa基因組分析儀(Illumina Genome Analyzer)
- ABI的SOLiD測序儀(ABI SOLiD sequencer)
- 優(yōu)點:
1. 不僅得到表達量,還可以對可變剪接和SNP進行研究玻孟;
2. 背景噪音小唆缴,無信號過飽和問題;
3. 數(shù)read的數(shù)目取募,所以精確度比基因芯片要高琐谤,且可重復性好;
4. 無克隆步驟玩敏,所以對樣品量的要求更低; - 缺點:
1. 測序片段長度相對較小质礼,對于較長的序列需要打碎成小片段建庫旺聚;
2. 高通量數(shù)據(jù)需要生信工具進行挖掘;
3. 測序深度與花費的矛盾
3. RNA-Seq的應用
RNA-Seq即對轉(zhuǎn)錄組進行測序和分析眶蕉。一般來說在研究所會委托公司測序得到數(shù)據(jù)自己進行后續(xù)的生信分析(質(zhì)控砰粹,mapping,差異基因表達分析造挽,SNV分析等)碱璃。RNA-Seq有著巨大的應用前景。
研究意義 作者:hoptop
- 在不同背景下比較mRNA水平
同一物種饭入,不同組織:研究基因在不同部分的表達情況
同一物種嵌器,同一組織:研究基因在不同處理下,不同條件下的表達變化
同一組織谐丢,不同物種:研究基因的進化關(guān)系
時間序列實驗: 基因在不同時期的表達情況與發(fā)育的關(guān)系- 基因分類: 找到細胞特異爽航,疾病相關(guān),處理相關(guān)的基因表達模式乾忱,用于診斷疾病和預測等
- 基因網(wǎng)絡(luò)和通路: 基因在細胞活動中的功能讥珍,基因間的相互作用。
以下例子選自什么是RNA-Seq (RNA Sequencing)
- 例1. 識別基因或者外顯子的邊界窄瘟,一次RNA-Seq就可以明確大量的基因和外顯子邊界衷佃;
- 例2. 擴展對轉(zhuǎn)錄復雜性的認識。對于人類而言蹄葱,RNA剪接事件已經(jīng)被確認的就有31618氏义,還有更多有待我們?nèi)ソ馑ル纾绕涫歉黝惣膊〕梢虻难芯浚槐热缢鼘Φ皖l度轉(zhuǎn)錄事件的發(fā)現(xiàn)觅赊,是研究生物噪音的一大利器右蕊。
- 因為RNA-Seq是可以定量的,所以可以應用于系統(tǒng)生物學方面并起到重要作用吮螺。
參考資料