RNAseq教程(2.3)

目錄

1.Module 1 - Introduction to RNA sequencing

  1. Installation
  2. Reference Genomes
  3. Annotations
  4. Indexing
  5. RNA-seq Data
  6. Pre-Alignment QC

2.Module 2 - RNA-seq Alignment and Visualization

  1. Adapter Trim
  2. Alignment
  3. IGV
  4. Alignment Visualization
  5. Alignment QC

3.Module 3 - Expression and Differential Expression

  1. Expression
  2. Differential Expression
  3. DE Visualization
  4. Kallisto for Reference-Free Abundance Estimation

4.Module 4 - Isoform Discovery and Alternative Expression

  1. Reference Guided Transcript Assembly
  2. de novo Transcript Assembly
  3. Transcript Assembly Merge
  4. Differential Splicing
  5. Splicing Visualization

5.Module 5 - De novo transcript reconstruction

  1. De novo RNA-Seq Assembly and Analysis Using Trinity

6.Module 6 - Functional Annotation of Transcripts

  1. Functional Annotation of Assembled Transcripts Using Trinotate

2.3 IGV

1.introduction

Description of the lab

高通量測序最受歡迎的工具-IGV(Integrative Genomics Viewer)

伴隨本教程的文件

完成本次教程可實現(xiàn)以下工作

  • 可視化各種基因組數(shù)據(jù)

  • 快速導航基因組

  • 可視化reads比對情況

  • 肉眼驗證SNP/SNV

Requirements

  • Integrative Genomics Viewer

  • Ability to run Java

  • Note that while most tutorials in this course are performed on the cloud, IGV will always be run on your local machine

Compatibility

本教程是為IGV v2.3準備的烤芦,可以在IGV下載頁面上找到。強烈建議使用這個版本析校。

Data Set for IGV

使用公開的來自HCC1143細胞系的Illumina序列數(shù)據(jù)构罗。HCC1143細胞系是從一名患有乳腺癌的52歲白人婦女體內(nèi)產(chǎn)生的。這個細胞系的附加信息可以在這里找到:HCC1143(tumor, TNM stage IIA, grade 3, primary ductal carcinoma)以及HCC1143/BL(matched normal EBV transformed lymphoblast cell line).

2. Getting familiar with IGV

Get familiar with the interface

載入一個基因組:

默認情況下智玻,IGV加載Human hg19遂唧。如果你研究的是另一個版本的人類基因組,或者另一種物種吊奢,你可以通過點擊左上角的下拉菜單來改變基因組盖彭。在這個教程中,我們將使用人類hg19。

也可以采用以下方式(File -> Load from Server...):

  • Ensembl genes (or your favourite source of gene annotations)
  • GC Percentage
  • dbSNP 1.3.1 or 1.3.7

Navigation:

在這個參考基因組中可以看到染色體列表召边,選擇1號染色體铺呵。

location字段(在界面的左上角)中輸入,導航到chr1:10 000- 11000隧熙,然后單擊Go片挂。這顯示了1號染色體的窗口寬1000個堿基對,從10000號位置開始贞盯。

IGV以顏色序列的形式顯示基因組中的堿基序列(例如A=綠色宴卖,C =藍色,等等)邻悬。這使得重復序列,比如在這個區(qū)域開始處發(fā)現(xiàn)的那些序列随闽,很容易識別父丰。放大一點使用+按鈕看到參考基因組序列的單個堿基。

你可以在基因組坐標所在的框中輸入你感興趣的基因掘宪,然后按Enter/Return鍵蛾扇。試試你最喜歡的基因,或者BRCA1魏滚。

基因用線和框表示镀首。線代表內(nèi)含子區(qū)域,框代表外顯子區(qū)域鼠次。箭頭表示該基因的轉(zhuǎn)錄方向/鏈更哄。當一個外顯子框變窄,這表示一個UTR腥寇。

Region Lists

有時成翩,保存當前位置或加載感興趣的區(qū)域真的很有用。為此赦役,IGV中有一個區(qū)域?qū)Ш狡髀榈小RL問它,單擊Regions > Region Navigator掂摔。在瀏覽基因組時术羔,可以隨時按Add按鈕保存一些書簽。

Loading Read Alignments

我們將使用乳腺癌細胞系HCC1143來可視化比對結(jié)果乙漓。在速度方面级历,只有一小部分chr21將裝載(19M:20M)。

HCC1143 Alignments to hg19:

復制文件到你的本地簇秒,并在IGV中選擇File > Load from File...鱼喉,選擇bam文件,并單擊OK。注意扛禽,為了讓IGV正確地加載它們锋边,bam文件和索引文件必須在同一個目錄中。

Visualizing read alignments

選擇染色體位點:chr21:19,480,041-19,480,386

To start our exploration, right click on the track-name, and select the following options:

  • Sort alignments by start location
  • Group alignments by pair orientation

通過右鍵點擊比對界面和切換選項來試驗各種設(shè)置编曼。想想哪一種方法最適合特定的任務(wù)(例如豆巨,質(zhì)量控制、SNP調(diào)用掐场、CNV查找)往扔。

3.Inspecting SNPs, SNVs, and SVs

Two neighbouring SNPs

  • Navigate to region chr21:19,479,237-19,479,814
  • Note two heterozygous variants, one corresponds to a known dbSNP (G/T on the right) the other does not (C/T on the left)
  • Zoom in and center on the C/T SNV on the left, sort by base (window chr21:19,479,321 is the SNV position)
  • Sort alignments by base
  • Color alignments by read strand

Homopolymer region with indel

Navigate to position chr21:19,518,412-19,518,497

Coverage by GC

Navigate to position chr21:19,611,925-19,631,555. Note that the range contains areas where coverage drops to zero in a few places.

**Example **

  • Use Collapsed view
  • Use Color alignments by -> insert size and pair orientation
  • Load GC track
  • See concordance of coverage with GC content

Heterozygous SNPs on different alleles

Navigate to region chr21:19,666,833-19,667,007

**Example **

  • Sort by base (at position chr21:19,666,901)

對于這兩個snp,等位基因之間沒有聯(lián)系熊户,因為兩個snp的reads都只包含一個或另一個

4.Automating Tasks in IGV

我們可以使用Tools菜單調(diào)用運行批處理腳本萍膛。IGV網(wǎng)站描述了批處理腳本:

下載數(shù)據(jù)集的批處理腳本和屬性文件:

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市嚷堡,隨后出現(xiàn)的幾起案子蝗罗,更是在濱河造成了極大的恐慌,老刑警劉巖蝌戒,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件串塑,死亡現(xiàn)場離奇詭異,居然都是意外死亡北苟,警方通過查閱死者的電腦和手機桩匪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來友鼻,“玉大人傻昙,你說我怎么就攤上這事√乙疲” “怎么了屋匕?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長借杰。 經(jīng)常有香客問我过吻,道長,這世上最難降的妖魔是什么蔗衡? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任纤虽,我火速辦了婚禮,結(jié)果婚禮上绞惦,老公的妹妹穿的比我還像新娘逼纸。我一直安慰自己,他們只是感情好济蝉,可當我...
    茶點故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布杰刽。 她就那樣靜靜地躺著菠发,像睡著了一般。 火紅的嫁衣襯著肌膚如雪贺嫂。 梳的紋絲不亂的頭發(fā)上滓鸠,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天,我揣著相機與錄音第喳,去河邊找鬼糜俗。 笑死,一個胖子當著我的面吹牛曲饱,可吹牛的內(nèi)容都是我干的悠抹。 我是一名探鬼主播,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼扩淀,長吁一口氣:“原來是場噩夢啊……” “哼楔敌!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起驻谆,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤梁丘,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后旺韭,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡掏觉,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年区端,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片澳腹。...
    茶點故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡织盼,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出酱塔,到底是詐尸還是另有隱情沥邻,我是刑警寧澤,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布羊娃,位于F島的核電站唐全,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蕊玷。R本人自食惡果不足惜邮利,卻給世界環(huán)境...
    茶點故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望垃帅。 院中可真熱鬧延届,春花似錦、人聲如沸贸诚。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至械念,卻和暖如春头朱,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背订讼。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工髓窜, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人欺殿。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓寄纵,卻偏偏與公主長得像,于是被迫代替她去往敵國和親脖苏。 傳聞我的和親對象是個殘疾皇子程拭,可洞房花燭夜當晚...
    茶點故事閱讀 42,762評論 2 345

推薦閱讀更多精彩內(nèi)容