寫在前面
IGV能夠?qū)⒒蚪M的變異情況可視化,因此廣泛應(yīng)用于基因組學(xué)的研究中迈嘹。
下面我以windows下的IGV為例衔憨,介紹一下IGV在查看基因組變異方面的應(yīng)用。
一.下載
下載鏈接如下:https://software.broadinstitute.org/software/igv/download
和一般的軟件下載情況類似席舍,不同的是,需要在電腦上安裝JAVA妄田,這個(gè)應(yīng)該難不倒各位看官老爺,因此不再贅述驮捍。
二.用戶使用手冊(cè)
官網(wǎng)的使用手冊(cè)包含以下18個(gè)方面疟呐,我主要關(guān)注的是 Viewing Data和Viewing Alignments。
- User Interface
- Navigating the View
- Loading a Genome
- External Control of IGV
- Viewing the Reference Genome
- Loading Data and Attributes
- Viewing Data
- Viewing Alignments
- Viewing Variants
- Multi-Locus View
- Regions of Interest
- Sample Attributes
- Sorting, Grouping, and Filtering
- Saving and Restoring Sessions
- Server Configuration
- Motif Finder
- igvtools
- BLAT search
1. Viewing Data
1.1 Default Display
IGV的一條track代表一個(gè)樣本或試驗(yàn)东且,每條track启具,IGV都會(huì)展示track identifier,一個(gè)或多個(gè)屬性珊泳,和track數(shù)據(jù)鲁冯,如圖所示。
當(dāng)導(dǎo)入文件時(shí)色查,IGV會(huì)根據(jù)文件的后綴名自動(dòng)識(shí)別文件薯演。如下圖所示。
1.2 Changing the Display
1.3 Segmented Data
1.4 GWAS Data
IGV可以像曼哈頓圖那樣展示GWAS數(shù)據(jù)秧了。
1.5 RNA Secondary Structure
2. Viewing Alignments
看的最多的比對(duì)文件就是下機(jī)數(shù)據(jù)比對(duì)到基因組的sam/bam文件跨扮。
導(dǎo)入IGV的bam要附帶著它的索引文件,這個(gè)可以由samtools
生成验毡。
Tracks
當(dāng)你導(dǎo)入bam文件時(shí)衡创,IGV會(huì)自動(dòng)搜索該路徑下的索引文件。
導(dǎo)入bam文件后晶通,會(huì)生成3個(gè)相關(guān)的tracks璃氢。
- Alignment Track(看單條比對(duì)reads)
- Coverage Track(看測(cè)序覆蓋的深度)
- Splice Junction Track(提供跨越剪接連接的讀取的另一種視角)
默認(rèn)情況下展示Alignment Track
和Coverage Track
。
Coverage Track
如果一個(gè)核苷酸與參考序列的差異大于20%的加權(quán)質(zhì)量reads, IGV會(huì)根據(jù)每個(gè)堿基的reads數(shù)的比例賦予染色狮辽。
- 通過(guò)右鍵單擊跟蹤并選擇設(shè)置等位基因頻率閾值來(lái)覆蓋單個(gè)覆蓋track的默認(rèn)閾值一也。
-
要更改所有覆蓋軌跡的默認(rèn)值巢寡,請(qǐng)?jiān)谝晥D> Preferences下的Alignments選項(xiàng)卡中設(shè)置覆蓋等位基因-分?jǐn)?shù)閾值。
將鼠標(biāo)懸停在覆蓋欄上查看計(jì)數(shù)細(xì)節(jié)塘秦。從右鍵菜單中復(fù)制計(jì)數(shù)細(xì)節(jié)到計(jì)算機(jī)的剪貼板讼渊。
Alignment Track
默認(rèn)情況下,匹配參考基因組的堿基展示為灰色尊剔。堿基的插入用紫色表示爪幻,堿基的刪除用黑色橫線表示。
-
Transparency for Mapped Reads
注意须误,如屏幕截圖所示挨稿,以淺灰色邊框和透明或白色填充顯示的對(duì)齊,其映射質(zhì)量為零京痢。
在這種情況下奶甘,reads也映射到另一個(gè)同樣好的位置。
也有可能reads不能被唯一地放置祭椰,但其他的放置不一定能帶來(lái)同樣高質(zhì)量的得分臭家。
-
Insertions
IGV用紫色或紅色表示堿基的插入,鼠標(biāo)懸浮能夠看到該堿基的詳細(xì)信息方淤。
-
Deletions
在有g(shù)ap的reads中钉赁,IGV用黑色短線表示相對(duì)于參考基因組的刪除。
Paired-End Alignments -
View As Pairs
默認(rèn)情況下携茂,IGV顯示單獨(dú)的reads你踩,因?yàn)樗鼈兙o密地打包在一起。
從右鍵菜單中選擇View as pairs讳苦,以如下圖所示的方式顯示連接兩端的成對(duì)带膜。鼠標(biāo)懸停(2)也會(huì)顯示在普通視圖(左)的單個(gè)reads或成對(duì)讀取視圖(右)的成對(duì)reads。
2.1 Interpreting Color by Insert Size
IGV使用不同的顏色來(lái)標(biāo)志異常的插入鸳谜。當(dāng)你在彈出菜單中通過(guò)插入大小選擇顏色對(duì)齊>
時(shí)膝藕,默認(rèn)的著色方案是:
-
Deletions
單端的缺失。
雙端的缺失咐扭。
在IGV中展示的結(jié)果束莫。
-
Insertions
單端示意圖。
雙端示意圖草描。
檢測(cè)到異常插入大小受片段大小的限制览绿。讀長(zhǎng)必須足夠長(zhǎng),以跨越插入位置穗慕,并包含兩端映射到參考基因組的序列饿敲,能檢測(cè)到的最大插入大小為:fragment length - (2x read length)。
IGV示意圖逛绵。
-
Inter-chromosomal Rearrangement
下面這個(gè)例子中怀各,reads一端在染色體1上倔韭,另一端在染色體6上。
2.2 Interpreting Color by Pair Orientation
成對(duì)reads的方向可用于檢測(cè)結(jié)構(gòu)變異事件瓢对,包括染色體倒置寿酌,復(fù)制和易位。
綠色硕蛹、藍(lán)綠色和深藍(lán)色的陰影表示倒置醇疼、復(fù)制和易位的結(jié)構(gòu)事件;不同的顏色取決于不同的平臺(tái)法焰。
Inversions
染色體上的倒置秧荆。
雙末端測(cè)序揭示的倒置。
在IGV上展示如下埃仪。
Inverted Duplication
當(dāng)一大段DNA被復(fù)制并以與原始序列相反的構(gòu)型插入基因組時(shí)乙濒,這被稱為反向復(fù)制。
這將會(huì)有重疊的左邊和右邊的reads卵蛉,并且有可能由覆蓋深度/拷貝數(shù)所決定颁股。
在IGV中展示如下。
Tandem Duplication
當(dāng)一大段DNA被復(fù)制并插入到基因組中原始序列的旁邊時(shí)傻丝,這被稱為串聯(lián)復(fù)制甘有。
IGV展示如下。
Translocation on the Same Chromosome
當(dāng)一大段DNA從一個(gè)位置移除并插入到其他位置時(shí)桑滩,這就是易位梧疲。
同一染色體上的易位可通過(guò)對(duì)取向的顏色編碼檢測(cè)允睹,而兩個(gè)染色體之間的易位可通過(guò)插入大小的染色檢測(cè)运准。
2.3 Interpreting Color by Bisulfite Mode
2.4 Splice Junctions
2.5 Sashimi Plot
未完待續(xù)~
參考鏈接:
http://software.broadinstitute.org/software/igv/UserGuide