參考:
https://www.bilibili.com/video/BV1XJ411r7bJ/?spm_id_from=333.788.videocard.0
定義
而轉錄組測序即是利用高通量測序技術猪杭,將細胞或組織中的全部或部分mRNA, miRNA, lnc RNA 進行測序分析的技術餐塘。
RNA-seq 應用
通過RNA-seq,也就是轉錄組測序皂吮,可以幫助我們了解各種比較條件下所有基因的表達差異包括:
正常組織與腫瘤組織戒傻;
藥物治療前后的表達差異;
發(fā)育過程中蜂筹,不同發(fā)育階段稠鼻,不同組織的表達差異……
不僅可以檢測,RNA 表達的差異狂票,還有RNA 結構的差異候齿。
轉錄組的主要目的之一便是尋找 基因表達的差異
。
測序方法(Truseq-RNA)
原始RNA樣本清理
由于獲取的RNA 大部分都是rRNA,只有2%, 3% 是mRNA 及其余的lncRNA, tRNA, miRNA 等慌盯。
因此主要用于RNA-seq 測定的mRNA 只占了很小的比例周霉。而獲得的大部分的RNA,tRNA 在各個物種和組織中是非常保守的亚皂,如果不是特別測定俱箱,一般不會得到什么有效信息。
RNA 建庫過程
介紹illumina 的Truseq-RNA 建庫方法灭必。
1)雜交
利用真核生物mRNA 尾部PolyA 修飾的特性狞谱,進行雜交。
2)打成短序列
將磁珠回收禁漓,也就篩選出了mRNA跟衅,再對這些片段洗脫,并打成短片段播歼。
3)逆轉錄
將短片段的RNA 進行逆轉錄伶跷,獲得第一鏈cDNA。
4)合成雙鏈
利用引物合成雙鏈cDNA秘狞。
5)連接接頭與擴增
到這一步叭莫,就和一般的基因測序一樣了。
再進行擴增烁试,也就建立了標準的測序文庫雇初。
接著就可以拿去測序了。
RNA 質量要求
RNA 必須要有比較高質量减响,因為開始的雜交是連接3' 的序列抵皱,因此如果mRNA 發(fā)生了降解,則遠離3' 端的序列就很容易被洗脫掉了辩蛋。
質量檢測
根據(jù)兩個峰的質量進行打分(RIN
值呻畸,最高10分,建議8分以上)悼院,通常來說這兩個峰值越高越尖伤为,打分越高,質量也越高据途。
數(shù)據(jù)分析
比對
將測序數(shù)據(jù)比對到基因組上绞愚。
質量控制
通常通過檢測比對后的RNA 分布進行判斷。
檢測RNA 片段有多少在3' 位置颖医,又有多少在5' 位置位衩。
如果左邊顯著不如右邊飽滿,則可能大部分的mRNA 發(fā)生了降解熔萧。
RPKM值(標準化處理)
具體計算參考:https://www.yuque.com/mugpeng/nwmnq7/cf7lm6
本質上就是一個數(shù)值的標準化處理糖驴。
差異分析
火山圖對比不同樣本的基因表達量對比僚祷。橫軸反映差異的大小,縱軸反映差異的顯著性贮缕。
相同差異大小的樣本辙谜,可能由于其樣本統(tǒng)計數(shù)的差異,因而造成了顯著性的差異(置信程度感昼,結果更可信)装哆。
聚類分析
對基因表達進行分群,可以找出它們的共同或不同特征定嗓。
富集分析
可以將差異基因富集到不同功能上蜕琴,探尋它們的功能特性。
從上到下基因的功能定義越來越精準宵溅,顏色越深凌简,其富集程度越高。
通路分析
結構變異檢測
建議測序數(shù)據(jù)在10G 以上层玲,以保證測序的覆蓋度号醉。
可變剪接
一般人類樣本反症,可以發(fā)現(xiàn)5000~20000個可變剪接辛块。
融合基因
融合基因指,某個基因頭融合到了其他基因的身體上铅碍。