RNAseq教程(4.5)

目錄

1.Module 1 - Introduction to RNA sequencing

  1. Installation
  2. Reference Genomes
  3. Annotations
  4. Indexing
  5. RNA-seq Data
  6. Pre-Alignment QC

2.Module 2 - RNA-seq Alignment and Visualization

  1. Adapter Trim
  2. Alignment
  3. IGV
  4. Alignment Visualization
  5. Alignment QC

3.Module 3 - Expression and Differential Expression

  1. Expression
  2. Differential Expression
  3. DE Visualization
  4. Kallisto for Reference-Free Abundance Estimation

4.Module 4 - Isoform Discovery and Alternative Expression

  1. Reference Guided Transcript Assembly
  2. de novo Transcript Assembly
  3. Transcript Assembly Merge
  4. Differential Splicing
  5. Splicing Visualization

5.Module 5 - De novo transcript reconstruction

  1. De novo RNA-Seq Assembly and Analysis Using Trinity

6.Module 6 - Functional Annotation of Transcripts

  1. Functional Annotation of Assembled Transcripts Using Trinotate

4.5 Transcript Assembly Visualization (Splicing Visualization)

Visualizing Results at the Command Line

從“de_novo”模式查看合并后的GTF文件锰瘸。請記住焊夸,這個(gè)合并的GTF文件結(jié)合了UHR和HBR(每個(gè)單獨(dú)的GTF也在前面生成)。

cd denovo
head stringtie_merged.gtf

有關(guān)該文件格式的細(xì)節(jié)阁簸,請查閱以下鏈接

在“de_novo”結(jié)果中渣窜,有多少基因至少有一個(gè)由StringTie組裝的轉(zhuǎn)錄本?

cat stringtie_merged.gtf | perl -ne 'if ($_ =~ /gene_id\s+\"(\S+)\"\;/){print "$1\n"}' | sort | uniq | wc -l
565

有多少基因至少組裝了一個(gè)潛在的新轉(zhuǎn)錄本?

head gffcompare.stringtie_merged.gtf.tmap
grep "j" gffcompare.stringtie_merged.gtf.tmap
grep "j" gffcompare.stringtie_merged.gtf.tmap | cut -f 1 | sort | uniq | wc -l
174

顯示具有最高閱讀支持度的基因間區(qū)域(候選新轉(zhuǎn)錄區(qū)域)的轉(zhuǎn)錄本

cd denovo
grep -w "u" gffcompare.stringtie_merged.gtf.tmap | sort -n -k 10 | column -t
-  -  u  MSTRG.481  MSTRG.481.1  3  0.000000  0.000000  0.000000  260  MSTRG.481.1  -
-  -  u  MSTRG.482  MSTRG.482.1  2  0.000000  0.000000  0.000000  267  MSTRG.482.1  -
-  -  u  MSTRG.54   MSTRG.54.1   2  0.000000  0.000000  0.000000  279  MSTRG.54.1   -
-  -  u  MSTRG.434  MSTRG.434.1  3  0.000000  0.000000  0.000000  281  MSTRG.434.1  -
-  -  u  MSTRG.484  MSTRG.484.1  2  0.000000  0.000000  0.000000  319  MSTRG.484.1  -
-  -  u  MSTRG.3    MSTRG.3.1    2  0.000000  0.000000  0.000000  320  MSTRG.3.1    -
-  -  u  MSTRG.200  MSTRG.200.1  2  0.000000  0.000000  0.000000  344  MSTRG.200.1  -
-  -  u  MSTRG.391  MSTRG.391.1  2  0.000000  0.000000  0.000000  346  MSTRG.391.1  -
-  -  u  MSTRG.2    MSTRG.2.1    2  0.000000  0.000000  0.000000  400  MSTRG.2.1    -
-  -  u  MSTRG.94   MSTRG.94.1   3  0.000000  0.000000  0.000000  424  MSTRG.94.1   -
-  -  u  MSTRG.410  MSTRG.410.1  2  0.000000  0.000000  0.000000  939  MSTRG.410.1  -

使用RegTools來注釋所有的可變剪切

RegTools用于幫助描述單個(gè)外顯子剪接事件呀枢,并幫助識別對基因表達(dá)或剪接模式有直接影響的新剪接事件霉晕。更多細(xì)節(jié)請參考RegTools手冊缕减。

使用RegTools的基本功能來提取可變剪切。每個(gè)bam的bed文件芒珠,它總結(jié)了RNA-seq數(shù)據(jù)中所表示的所有不同的外顯子-外顯子剪接事件桥狡。我們還將使用RegTools對這些連接進(jìn)行注釋,以參考我們的GTF轉(zhuǎn)錄組文件:

cd align
regtools junctions extract -s 0 HBR.bam -o HBR.junctions.bed
head HBR.junctions.bed
    
regtools junctions annotate HBR.junctions.bed  ../chr22_with_ERCC92.fa ../chr22_with_ERCC92.gtf > HBR.junctions.anno.bed
head HBR.junctions.anno.bed

regtools junctions extract -s 0 UHR.bam -o UHR.junctions.bed
head UHR.junctions.bed
    
regtools junctions annotate UHR.junctions.bed  ../chr22_with_ERCC92.fa ../chr22_with_ERCC92.gtf > UHR.junctions.anno.bed
head UHR.junctions.anno.bed

現(xiàn)在從樣本中找出任何可能涉及新外顯子跳躍皱卓、受體位點(diǎn)使用或供體位點(diǎn)使用的連接(相對于參考轉(zhuǎn)錄組GTF)裹芝。

grep -P -w "NDA|A|D" HBR.junctions.anno.bed | perl -ne 'chomp; @l=split("\t",$_); if ($l[4] > 3){print "$_\n"}'
grep -P -w "NDA|A|D" UHR.junctions.anno.bed | perl -ne 'chomp; @l=split("\t",$_); if ($l[4] > 3){print "$_\n"}'

轉(zhuǎn)換成GTF文件查看

為了更容易比較僅ref-only, ref-guided, de novo 的結(jié)果的輸出,我們現(xiàn)在將生成合并后的GTF文件的過濾版本娜汁,我們將刪除轉(zhuǎn)錄本嫂易,除非有證據(jù)表明它們的表達(dá)。

wget https://github.com/griffithlab/rnaseq_tutorial/blob/master/scripts/stringtie_filter_gtf.pl
perl stringtie_filter_gtf.pl --expression_metric=FPKM --result_dirs='HBR_Rep1,HBR_Rep2,HBR_Rep3,UHR_Rep1,UHR_Rep2,UHR_Rep3' --input_gtf_file='../chr22_with_ERCC92.gtf' --filtered_gtf_file='chr22_with_ERCC92.filtered.gtf' --exp_cutoff=0 --min_sample_count=2
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末掐禁,一起剝皮案震驚了整個(gè)濱河市怜械,隨后出現(xiàn)的幾起案子颅和,更是在濱河造成了極大的恐慌,老刑警劉巖缕允,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件峡扩,死亡現(xiàn)場離奇詭異,居然都是意外死亡障本,警方通過查閱死者的電腦和手機(jī)教届,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來驾霜,“玉大人案训,你說我怎么就攤上這事》嗖冢” “怎么了强霎?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長猜旬。 經(jīng)常有香客問我脆栋,道長,這世上最難降的妖魔是什么洒擦? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任椿争,我火速辦了婚禮,結(jié)果婚禮上熟嫩,老公的妹妹穿的比我還像新娘秦踪。我一直安慰自己,他們只是感情好掸茅,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布椅邓。 她就那樣靜靜地躺著,像睡著了一般昧狮。 火紅的嫁衣襯著肌膚如雪景馁。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天逗鸣,我揣著相機(jī)與錄音合住,去河邊找鬼。 笑死撒璧,一個(gè)胖子當(dāng)著我的面吹牛透葛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播卿樱,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼僚害,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了繁调?” 一聲冷哼從身側(cè)響起萨蚕,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤靶草,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后门岔,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體爱致,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年寒随,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了糠悯。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,779評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡妻往,死狀恐怖互艾,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情讯泣,我是刑警寧澤纫普,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站好渠,受9級特大地震影響昨稼,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜拳锚,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一假栓、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧霍掺,春花似錦匾荆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至兔魂,卻和暖如春烤芦,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背析校。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工构罗, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人勺良。 一個(gè)月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像骄噪,于是被迫代替她去往敵國和親尚困。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容