1.背景知識(shí)
1.1什么是可變剪切
可變剪切(differential splicing)也叫做選擇性剪切alternative splicing, 指的是在mRNA前體到成熟mRNA的過(guò)程當(dāng)中,不同的剪切方式使得同一個(gè)基因可以產(chǎn)生多個(gè)不同的成熟mRNA, 最終產(chǎn)生不同的蛋白質(zhì),在不同組織或者發(fā)育的不同階段茂嗓,可變剪切不是一成不變的隔缀,在特定的組織或者條件下,會(huì)產(chǎn)生特定的剪切異構(gòu)體isofrom, 這說(shuō)明不同異構(gòu)體具有特定的時(shí)間與空間作用,從而將可變剪切與正常的生命活動(dòng)和疾病相關(guān)聯(lián),有大量的研究發(fā)現(xiàn),可變剪切的變化與癌癥等多種疾病相關(guān)鼠锈,所以研究可變剪切在不同組織中的研究是非常有意義的[1]。
1.2 可變剪切類型
在生物體內(nèi)星著,主要存在7種可變剪接類型[2]:
- ES(Exon skip)指一個(gè)外顯子從初始轉(zhuǎn)錄物上被剪切掉购笆。基因發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本强饮, 第1種轉(zhuǎn)錄本比第2種轉(zhuǎn)錄組本多一個(gè)外顯子由桌,我們將這種外顯子稱為inclusive exon,inclusive exon兩側(cè)的兩個(gè)外顯子稱為constitutive exon邮丰。
- RI(Retained intron):基因發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本行您, 第2種轉(zhuǎn)錄本由retained Intron與兩側(cè)的外顯子一起形成新的外顯子。
- AD(Alternate Donor site):基因發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本剪廉,它們的3'端剪接位點(diǎn)一致但5'端剪接位點(diǎn)不同娃循, 第二種轉(zhuǎn)錄本的5'端外顯子有所延長(zhǎng)。
- AA(Alternate acceptor site):基因發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本斗蒋,它們的5'端剪接位點(diǎn)一致但3'端剪接位點(diǎn)不同捌斧, 第二種轉(zhuǎn)錄本的3'端外顯子有所延長(zhǎng)。
- AP(Alternate promoter):基因的兩個(gè)轉(zhuǎn)錄本的區(qū)別在于第一個(gè)外顯子不同泉沾,這樣的可變剪接事件稱為Alternative First Exon捞蚂。
- AT(Alternate terminator):基因的兩個(gè)轉(zhuǎn)錄本的不同之處于最后一個(gè)外顯子不同,這樣的可變剪接事件稱為Alternative last exon跷究。
-
ME(Mutually exclusive exons):基因發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本姓迅,兩轉(zhuǎn)錄本之間相同的外顯子稱為constitutive exon, 不同的外顯子稱為inclusive exon,兩個(gè)inclusive exon不能同時(shí)存在與同一轉(zhuǎn)錄本中丁存, 只能分別存在于不同轉(zhuǎn)錄本中肩杈。 這樣的可變剪接事件稱為Mutually Exclusive Exon。
2.分析策略
Hisat2+StringTie+Astalavista
Hisat2用于將轉(zhuǎn)錄組測(cè)序數(shù)據(jù)比對(duì)到參考基因組(Camellia sinensis)解寝,使用samtools將sam文件轉(zhuǎn)換成bam文件并構(gòu)建索引扩然,Stringtie將利用上一步samtools生成的bam文件獲得gtf文件,最后Astalavista可從gtf文件中檢測(cè)可能存在的可變剪切事件聋伦。
3.軟件的安裝與使用
3.1 Hisat2的安裝與使用
3.1.1 Hisat2安裝
直接使用miniconda進(jìn)行安裝夫偶,解決所有依賴軟件。
conda create -n hisat2
conda activate hisat2
conda install -c bioconda hisat2=2.1.1.0
#創(chuàng)建環(huán)境并安裝指定版本的的hisat2
下載安裝包自行安裝觉增,Hisat2安裝包下載地址:Download | HISAT2 (daehwankimlab.github.io)
索守,下載指定版本的安裝包。
wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.1.0-Linux_x86_64.zip
unzip hisat2-2.1.0-Linux_x86_64.zip
export PATH=path/to/your/hisat2-2.1.0:$PATH
source ~/.bashrc
3.1.2 Hisat2構(gòu)建參考基因組
在正式比對(duì)前還需要構(gòu)建參考基因組抑片,所使用的軟件是hisat2,基本命令為hisat2 -build,基礎(chǔ)命令為:
hisat2-build /path/to/the/genome.fasta /path/to/your/output/genome 1>hisat2-build.log 2>&1
以上各代碼各部分分別為:
/path/to/the/genome.fasta:參考基因組所處位置;
/path/to/your/output/genome:輸出文件所存儲(chǔ)位置及所使用的前綴;
1>hisat2-build.log 2>&1:將標(biāo)準(zhǔn)輸出流與錯(cuò)誤輸出流同時(shí)輸入到hisat2_build.log這個(gè)文件中杨赤。
3.2 samtools的安裝與使用
3.2.1 samtools安裝
通過(guò)miniconda安裝敞斋,一步到位。
conda create -n samtools
conda activate samtools
conda install -c bioconda samtools=1.18
#創(chuàng)建samtools的安裝環(huán)境并安裝指定版本的samtools
3.2.2 使用samtools轉(zhuǎn)換格式與構(gòu)建索引
samtools sort -o output.bam input.sam
#將sam文件轉(zhuǎn)換為bam文件疾牲,輸入為sam文件植捎,輸出為bam文件
samtools index input.bam
#samtools對(duì)bam文件進(jìn)行索引構(gòu)建
3.3 Stringtie的安裝與使用
conda create -n stringtie
conda activate stringtie
conda install -c bioconda stringtie=2.2.1
#創(chuàng)建環(huán)境并安裝指定版本的stringtie
stringtie基本使用方法
stringtie input.bam -p 16 -v -o stringtie.gtf -A abundance.txt
input.bam:是輸入的 BAM 文件路徑,即待進(jìn)行轉(zhuǎn)錄組裝的 BAM 文件.
-p 16: 這個(gè)選項(xiàng)指定了并行處理的線程數(shù).
-v: 這個(gè)選項(xiàng)用于開啟詳細(xì)的輸出信息(verbose mode)阳柔,顯示更多關(guān)于程序運(yùn)行的詳細(xì)信息焰枢。**
-o stringtie.gtf: 這個(gè)選項(xiàng)指定輸出的 GTF 文件的名稱和路徑。
-A abundance.txt: 這個(gè)選項(xiàng)指定輸出一個(gè)文本文件舌剂,其中包含每個(gè)基因的表達(dá)量信息济锄。
3.4 Astalavista的安裝與使用
conda create -n asvista
conda activate asvista
conda install -c bioconda astalavista=4.4
#創(chuàng)建環(huán)境并安裝對(duì)應(yīng)版本的astalavista
Astalavista基本使用命令:
astalavista -t asta --threads 24 -i input.gtf -o output_gtf.gz
將output_gtf.gz解壓后就會(huì)得到可變剪切的信息文件,Astalavista軟件產(chǎn)生的結(jié)果是用各種符號(hào)組合來(lái)表示的霍转,不同符號(hào)類型表示不同的可變剪切類型:對(duì)于簡(jiǎn)單AS事件荐绝,AStalavista軟件定義AS編碼0,1–2?( '為外顯子跳躍( ES ),1?,2?為替代供體( A5SS )避消,1-,2-為替代受體( A3SS )低滩,'0, 1?2-為內(nèi)含子保留( IR ),'1–2?, 3–4?為相互外顯子跳躍( MXE*)岩喷。
參考文獻(xiàn)
[1]可變剪切分析(一)詳細(xì)教程 - 知乎 (zhihu.com)
[2]7種可變剪接類型(TCGA可變剪切)-生信自學(xué)網(wǎng) (biowolf.cn)