最近在學RNA-Seq县耽,從收集資料開始,將好用的鏈接先拷過來亲怠,方便閱讀:
背景:
生信技能樹:RNA-Seq這十年
嗯、這篇文章寫的很全柠辞,從一篇綜述翻譯過來的团秽,介紹了短讀長和長讀長(PacBio / Oxford Nanopore(ONT)) 、還有direct RNA的一些特點(不需要cDNA合成和PCR擴增操作叭首,消除了常規(guī)操作帶來的biase习勤,且可以保留表觀遺傳學特性)...
long-read Sequencing較于短讀長優(yōu)缺點:
長讀長有助于檢測isoforms、 利于3’端alternative polyA分析
缺陷:
1焙格、 測序通量小
在Illumina平臺上图毕,運行單次的RNA-seq可以生成10E9-10E10條短讀長,但是在PacBio和ONT平臺上眷唉,一次RNA-seq則只能產(chǎn)生10E6-10E7條讀長吴旋。這種低通量限制了應用長讀長測序技術進行實驗的規(guī)模,并降低了對差異基因表達檢測的靈敏性厢破。
2荣瑟、測序錯誤率更高
這里要get一個詞CCS(circular consensus-sequencing,環(huán)形一致性測序)摩泪,針對PacBio(PacBio測序原理圖如下)笆焰。
3、靈敏度受限
No. 31 RNA-Seq建庫用哪種策略见坑?
- 第1方面嚷掠,最終拿去測序儀進行測序的一定都是DNA片段捏检,因此我們需要對實驗提取到的RNA序列進行反轉(zhuǎn)錄成cDNA,然后再進行連接adapter不皆。
- 第2方面贯城,細胞中含量最多的是rRNA,其次是tRNA霹娄,mRNA與lncRNA只占大約5%左右甚至更低能犯,而我們真正關心的往往就是mRNA與lncRNA代表的基因表達量。
建庫策略
- PolyA
在絕大多數(shù)情況下犬耻,我們關心的gene都是protein coding gene或者是與其結構非常詳細的lncRNA(long non-coding RNA)這些gene在形成成熟的mRNA以后踩晶,往往都會在3'末端帶有polyA 尾巴;同時枕磁,成熟的tRNA渡蜻,rRNA,miRNA等等都不帶有經(jīng)典的polyA尾巴计济。
使用一段 帶有能與A配對的T的磁珠就可以與對應的帶有polyA尾巴的RNA結合茸苇,隨后再經(jīng)過隨機打斷,反轉(zhuǎn)錄沦寂,加adapter就可以完成建庫税弃,這樣的建庫策略叫做polyA + 或者 polyA positive。
- rRNA minus
那么polyA positive策略有個比較大的問題就是凑队,會丟掉很多不帶有polyA尾巴的RNA序列则果,比如tRNA,比如有些lncRNA以及一些特殊的mRNA漩氨。
這個過程是對rRNA進行若干次的消化西壮,使得rRNA都被降解而其他類型的RNA不受影響。隨后再進行隨機打斷叫惊,反轉(zhuǎn)錄款青,加adapter。這種RNA-Seq的建庫策略為rRNA - 或稱為 rRNA minus霍狰。
RNA質(zhì)檢三步曲
1抡草、 Nanodrop 2000
純RNA,其A260/A280約為2
OD260/OD280 介于1.8到2.1間蔗坯,大于2.1康震,則為基因組污染;小于1.8則為蛋白質(zhì)污染宾濒;
OD230/OD260 介于0.4-0.5間腿短,大于0.5說明樣本中有鹽和小分子雜質(zhì)污染,小于0.4則考慮基因組污染;
2橘忱、 Qubit 3.0 進行濃度定量
3赴魁、 Agilent 4200 測量RNA完整性RIN值
一般RIN值取值為1-10之間,mRNA大于7則為RNA完整性較好钝诚;lnc颖御、circle、miRNA測序要求RIN值大于6凝颇。
Bioinformation:
1潘拱、 初始數(shù)據(jù)過濾、質(zhì)控
NGS 數(shù)據(jù)過濾之 Trimmomatic 詳細說明
GSEA
參考資料: GSEA富集分析
表達量驗證:
Date: 2019-10-29
昨晚轉(zhuǎn)錄組分析祈噪,需要用qRT-PCR進行定量檢驗基因表達量,今天正好和實驗組的人討論了一份用相對定量法檢測缺失的報告尚辑,記錄一些相關的信息辑鲤。
個人理解:
擴增曲線基本如下所示,類似于細菌生長的S型曲線杠茬,主要是基線期月褥、指數(shù)增長期和平臺期。其中指數(shù)增長期與初始的DNA量有關瓢喉,初始DNA量越大宁赤,ct值越小,在圖中表示為越早出峰栓票。這里面有個ct值的概念决左,ct值可以理解為每個反應管內(nèi)的熒光信號達到設定的域值時所經(jīng)歷的循環(huán)數(shù) (cycle)。所以如果出現(xiàn)了DNA片段的缺失走贪,ct值在擴增曲線上會表現(xiàn)出相對于陰性對照更晚出現(xiàn)的S型曲線佛猛。另外還有一個參考的值2^-ΔΔCt ,做這個分析時還需要對陰性對照和樣本取一個內(nèi)參基因坠狡,例如GADPH继找,做校正,最后獲得目標基因的2^-ΔΔCt值逃沿。