轉(zhuǎn)錄組分析文章筆記

Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown

用HISAT, StringTie 和 Ballgown來進行轉(zhuǎn)錄組測序數(shù)據(jù)的表達水平分析

ps：文章省略了數(shù)據(jù)的質(zhì)控贝或，去除污染物术唬，去除接頭等操作围段，直接從序列比對開始

分析流程可以分成4個主要的方面：

?(i)? alignment?of? the? reads?to? the? genome;

?(ii)? assembly? of? thealignments into full-length transcripts;

?(iii) quantification of the expressionlevels of each gene and transcript; and

?(iv) calculation of? the?differences? in? expression?for? all? genes?among? the different?experimental? conditions.

1 比對reads到gene組

2將alignments?組裝成完整的轉(zhuǎn)錄本

3定量每個gene或者轉(zhuǎn)錄本的表達水平

4計算不同實驗條件下所有g(shù)ene表達差異

分析使用的3個軟件的分別作用：

HISAT：alignsRNA-seq reads to a genome and discovers transcript splice sites

HISAT：比對RNA測序的reads到基因組和已知的轉(zhuǎn)錄剪切位點

StringTie：assembles? the?alignments? into? full?and? partial? tran-scripts, creating multiple isoforms asnecessary and estimating ?the expression levels of all genes and transcripts.

StringTie：組裝?alignments到全部或者部分轉(zhuǎn)錄組漓库，生成多個isoforms徘公，計算所有g(shù)ene和transcripts的表達水平

Ballgown：takes thetranscripts and expression levels from StringTie and applies rigorous? statistical?methods? to? determine?which? transcripts are? differentially? expressed?between? two? or?more? experiments.

Ballgown：導(dǎo)入StringTie生成的轉(zhuǎn)錄本以及表達水平結(jié)果，采用嚴格的統(tǒng)計方法來確認在不同實驗條件下差異表達的?transcripts

具體流程圖：

Figure 1 | An overview of the ‘new Tuxedo’ protocol.

具體流程：

*FASTQC和FASTX toolkit進行原始RNA測序數(shù)據(jù)的質(zhì)控：去除污染物逛犹，去除接頭舱呻，低質(zhì)量的序列

1 用HISAT將樣本的read比對到參考基因組

2 比對結(jié)果傳送到stringtie進行轉(zhuǎn)錄本拼接

3 用stingtie的merge功能將拼接后的轉(zhuǎn)錄本進行融合

（Cufflinks的cuffmerge功能能代替atingtie的merge功能）

4 融合后的轉(zhuǎn)錄本回送到stingtie，重新計算轉(zhuǎn)錄本的豐度

?stringtie:gffcompre確定拼接的轉(zhuǎn)錄本多少匹配到已經(jīng)注釋的gene怯晕，多少是完全新的

5 stingtie提供轉(zhuǎn)錄本的read數(shù)量

? stringtie傳送三類數(shù)據(jù)至ballgown

(i)phenotype data—information about the samples being collected;

(ii)expression data—normalized and un-normalized measures of the amount of eachexon, junction, transcript and gene expressed in each sample;

(iii)genomic information— coordinates giving the location of the exons, introns,transcripts and? genes,? as?well? as? annotation?including? information? such?as gene names.

A 表型數(shù)據(jù)：收集的樣本信息

B 表達數(shù)據(jù)：標準化或未標準化的內(nèi)顯子潜圃，junction，轉(zhuǎn)錄本舟茶，gene的表達信息

C gene組信息：內(nèi)外顯子轉(zhuǎn)錄本等的位置信息谭期，或者gene名稱等

6 ballgown根據(jù)不同實驗條件計算差異表達gene

ballgown分析流程：

A? ?loading the data into R.

載入由stingtie產(chǎn)生的豐度數(shù)據(jù)和描述樣本的表型信息數(shù)據(jù)到R?

劃重點：確保gene組樣本的id與表型數(shù)據(jù)的id一致

B?inspectthe distribution of abundance estimates for the transcripts.

檢查轉(zhuǎn)錄本豐度估計的分布

劃重點：豐度估計由FPKM表示，每1百萬個map上的reads中map到外顯子的每1K個堿基上的reads個數(shù)

ballgown的stattest功能：直接標記任何已知的干擾因子

C?The result is a table with information on thefeature tested for differential expression

差異表達的特征檢驗

具體的軟件安裝與執(zhí)行代碼吧凉，文章中有具體列出崇堵，這里就不累述。詳細請閱讀文章客燕。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市狰贯，隨后出現(xiàn)的幾起案子也搓，更是在濱河造成了極大的恐慌，老刑警劉巖涵紊，帶你破解...
沈念sama閱讀 206,126評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件傍妒，死亡現(xiàn)場離奇詭異，居然都是意外死亡摸柄，警方通過查閱死者的電腦和手機颤练，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來驱负，“玉大人嗦玖，你說我怎么就攤上這事患雇。” “怎么了宇挫？”我有些...
開封第一講書人閱讀 152,445評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵苛吱，是天一觀的道長。經(jīng)常有香客問我器瘪，道長翠储，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,185評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任橡疼，我火速辦了婚禮援所，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘欣除。我一直安慰自己住拭，他們只是感情好，可當我...
茶點故事閱讀 64,178評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布耻涛。她就那樣靜靜地躺著废酷，像睡著了一般。火紅的嫁衣襯著肌膚如雪抹缕。梳的紋絲不亂的頭發(fā)上澈蟆，一...
開封第一講書人閱讀 48,970評論 1贊 284
城市分裂傳說
那天，我揣著相機與錄音卓研，去河邊找鬼趴俘。笑死，一個胖子當著我的面吹牛奏赘，可吹牛的內(nèi)容都是我干的寥闪。我是一名探鬼主播，決...
沈念sama閱讀 38,276評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼磨淌，長吁一口氣：“原來是場噩夢啊……” “哼疲憋！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起梁只，我...
開封第一講書人閱讀 36,927評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤缚柳，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后搪锣，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體秋忙，經(jīng)...
沈念sama閱讀 43,400評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,883評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年构舟，在試婚紗的時候發(fā)現(xiàn)自己被綠了灰追。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 37,997評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖弹澎，靈堂內(nèi)的尸體忽然破棺而出朴下，到底是詐尸還是另有隱情，我是刑警寧澤裁奇，帶...
沈念sama閱讀 33,646評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布桐猬，位于F島的核電站，受9級特大地震影響刽肠，放射性物質(zhì)發(fā)生泄漏溃肪。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 39,213評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一音五、第九天我趴在偏房一處隱蔽的房頂上張望惫撰。院中可真熱鬧，春花似錦躺涝、人聲如沸厨钻。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,204評論 0贊 19
一樁弒父案坚嗜，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽夯膀。三九已至，卻和暖如春苍蔬，著一層夾襖步出監(jiān)牢的瞬間诱建，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,423評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工碟绑，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留俺猿，地道東北人。一個月前我還...
沈念sama閱讀 45,423評論 2贊 352
代替公主和親
正文我出身青樓格仲，卻偏偏與公主長得像押袍，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子凯肋，可洞房花燭夜當晚...
茶點故事閱讀 42,722評論 2贊 345

轉(zhuǎn)錄組分析文章筆記

Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown

推薦閱讀更多精彩內(nèi)容