scDAPA:從單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)中檢測(cè)可變聚腺苷酸化(APA)

多聚腺苷化(polyadenylation,poly(A))是轉(zhuǎn)錄本成熟過(guò)程中在3'末端發(fā)生的重要修飾步驟制跟。選擇性多聚腺苷化(Alternative Poly(A),APA)是真核生物中一種廣泛存在的基礎(chǔ)調(diào)控機(jī)制,不僅增加細(xì)胞中轉(zhuǎn)錄組和蛋白組的復(fù)雜性印屁,并且影響目標(biāo)RNA的功能、穩(wěn)定性斩例、定位和翻譯效率雄人。Poly(A)位點(diǎn)標(biāo)識(shí)著轉(zhuǎn)錄本末尾,其準(zhǔn)確識(shí)別是基因注釋和轉(zhuǎn)錄調(diào)控機(jī)制研究的基礎(chǔ)念赶。APA表現(xiàn)出組織特異性础钠,對(duì)細(xì)胞增殖和分化具有重要作用。

選擇性聚腺苷酸(APA)在真核生物的mRNA穩(wěn)定性和功能中起著關(guān)鍵的轉(zhuǎn)錄后調(diào)控作用叉谜。單細(xì)胞RNA-seq (scRNA-seq)是發(fā)現(xiàn)基因表達(dá)水平細(xì)胞異質(zhì)性的有力工具旗吁。最常用的 10× scRNA-seq 3’豐富的建庫(kù)策略, 使我們能夠?qū)PA的研究分辨率提高到單細(xì)胞水平停局。然而很钓,目前還沒(méi)有可用的計(jì)算工具來(lái)調(diào)查來(lái)自scRNA-seq數(shù)據(jù)的APA概況。

在這里董栽,我們提出了一個(gè)軟件包scDAPA檢測(cè)和可視化動(dòng)態(tài)APA從scRNA-seq數(shù)據(jù)码倦。以bam/sam文件和細(xì)胞簇標(biāo)簽為輸入,scDAPA使用基于直方圖的方法和Wilcoxon秩和檢驗(yàn)檢測(cè)APA動(dòng)態(tài)锭碳,并使用動(dòng)態(tài)APA可視化候選基因袁稽。對(duì)標(biāo)結(jié)果表明,scDAPA能從scRNA-seq數(shù)據(jù)中有效識(shí)別不同細(xì)胞群中具有動(dòng)態(tài)APA的基因工禾。 :https://scdapa.sourceforge.io.

一运提、APA類(lèi)型:

(1)3’UTRAPA

大部分APA位點(diǎn)處于含有順勢(shì)作用元件(ciselements)的3’UTR區(qū),3’UTR-APA會(huì)對(duì)轉(zhuǎn)錄后基因調(diào)控產(chǎn)生許多影響闻葵,如mRNA穩(wěn)定性民泵、mRNA核轉(zhuǎn)移和定位以及編碼蛋白定位。

圖1. 3’UTR APA示意圖[1]

(2)Upstream Region APA(UR-APA)

UR-APA位點(diǎn)位于最后一個(gè)外顯子前槽畔,UR-APA引起末端外顯子的可變表達(dá)栈妆,導(dǎo)致mRNA編碼序列和3’UTR的變化。根據(jù)polyadenylation sites(PAS)的剪接模型,可將UR-APA分為兩類(lèi):Skipped terminal exon和Composite terminal exon鳞尔。Skipped terminal exon略過(guò)了末端外顯子嬉橙,而Composite terminal exon則由內(nèi)部外顯子延伸產(chǎn)生。

圖2. UR-APA示意圖[1]
unset PYTHONPATH 
source  software/miniconda3/bin/activate software/miniconda3/envs/velocyto

10X_RNA/Development/scDAPA/extractReads.sh -r  10X_RNA/Development/velocyto/example/CellRanger/pbmc5k/outs/possorted_genome_bam.bam -c 10X_RNA/Development/velocyto/example/CellRanger/pbmc5k/outs/analysis/clustering/kmeans_10_clusters/clusters.csv  -o ./result


10X_RNA/Development/scDAPA/extractGenes.sh -i10X_RNA/pipeline2.1/database/10X_Ref/refdata-cellranger-GRCh38-1.2.0/genes/genes.gtf  -o hg38.gene.gff 
export PATH=bedtools2/bin/:$PATH
10X_RNA/Development/scDAPA/annotate3Ends.sh  -d 10X_RNA/Development/scDAPA/example/result/  -g  10X_RNA/Development/scDAPA/example/hg38.gene.gff 

anno
Column Name Explanation
seqname The name of the sequence
source The program that generated this feature
feature The name of this type of feature
start The starting position of the feature in the sequence
end The ending position of the feature
score A score between 0 and 1000
strand Valid entries include "+", "-", or "."
frame If the feature is not a coding exon, the value should be "."
gene Gene ID and name
start of read The starting positions of reads annoted to this gene, separated by comma
end of read The ending positions of reads annoted to this gene, separated by comma

將上述結(jié)果導(dǎo)入R包scDAPAminer

> library(scDAPAminer)
> # creat a folder named 'stat'
> # 1. only compare two specific cell groups
> scDAPAdetect(file1='./result/1.anno',file2='./result/2.anno',type='f2f',output_dir='./stat')
> 
> # 2. compare every two cell groups stored in the ./result directory
> scDAPAdetect(dir='./result',type='d',output_dir='./stat',bin_size=100,count_cutoff=20)
Column Name Explanation
chr Name of the chromosome/scaffold
gene Gene ID and name
meanlen1 Mean length of 3′ ends to gene's start site in cell group 1
meanlen2 Mean length of 3′ ends to gene's start site in cell group 2
SDD Site distribution difference SDD∈[0,1]
p.value Statistical test p values
p.adjust Adjusted p values
> dp = scDAPAview(files=c('./result/1.anno','./result/2.anno'),alt_names=c('cell_A','cell_B'),gtf=gtf,gene_id='ENSG00000160062',legend.position = c(0.2,0.8))
> 
> # customize colour theme
> library(ggsci)
> dp + scale_colour_aaas()
> 
> # customize legend title
> dp + labs(colour = "Cell type")
> 
> # customize legend position
> dp + theme(legend.position = c(0.6, 0.9))
> 
> # customize simultaneuouly
> dp + scale_colour_aaas() + labs(colour = "Cell type") + theme(legend.position = c(0.6, 0.9))



[1]Tian B, Manley J L. Alternative polyadenylation of mRNA precursors[J]. Nature Reviews Molecular Cell Biology, 2016, 18(1):18.

[2]Abdelghany S E, Hamilton M, Jacobi J L, et al. A survey of the sorghum transcriptome using single-molecule long reads[J]. Nature Communications, 2016, 7:11706.

http://www.frasergen.com/cn/info_173.aspx?itemid=258

Congting Ye, Qian Zhou, Xiaohui Wu, Chen Yu, Guoli Ji, Daniel R Saban, Qingshun Q Li, scDAPA: detection and visualization of dynamic alternative polyadenylation from single cell RNA-seq data, Bioinformatics, , btz701, https://doi.org/10.1093/bioinformatics/btz701

高通量測(cè)序技術(shù)在可選擇性多聚腺苷酸化研究中的應(yīng)用

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末寥假,一起剝皮案震驚了整個(gè)濱河市市框,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌糕韧,老刑警劉巖枫振,帶你破解...
    沈念sama閱讀 206,602評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異萤彩,居然都是意外死亡粪滤,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,442評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)雀扶,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)杖小,“玉大人,你說(shuō)我怎么就攤上這事愚墓∮枞ǎ” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,878評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵转绷,是天一觀的道長(zhǎng)伟件。 經(jīng)常有香客問(wèn)我,道長(zhǎng)议经,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,306評(píng)論 1 279
  • 正文 為了忘掉前任谴返,我火速辦了婚禮煞肾,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘嗓袱。我一直安慰自己籍救,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,330評(píng)論 5 373
  • 文/花漫 我一把揭開(kāi)白布渠抹。 她就那樣靜靜地躺著蝙昙,像睡著了一般。 火紅的嫁衣襯著肌膚如雪梧却。 梳的紋絲不亂的頭發(fā)上奇颠,一...
    開(kāi)封第一講書(shū)人閱讀 49,071評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音放航,去河邊找鬼烈拒。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的荆几。 我是一名探鬼主播吓妆,決...
    沈念sama閱讀 38,382評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼吨铸!你這毒婦竟也來(lái)了行拢?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,006評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤诞吱,失蹤者是張志新(化名)和其女友劉穎舟奠,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體狐胎,經(jīng)...
    沈念sama閱讀 43,512評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡鸭栖,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,965評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了握巢。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片晕鹊。...
    茶點(diǎn)故事閱讀 38,094評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖暴浦,靈堂內(nèi)的尸體忽然破棺而出溅话,到底是詐尸還是另有隱情,我是刑警寧澤歌焦,帶...
    沈念sama閱讀 33,732評(píng)論 4 323
  • 正文 年R本政府宣布飞几,位于F島的核電站,受9級(jí)特大地震影響独撇,放射性物質(zhì)發(fā)生泄漏屑墨。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,283評(píng)論 3 307
  • 文/蒙蒙 一纷铣、第九天 我趴在偏房一處隱蔽的房頂上張望卵史。 院中可真熱鬧,春花似錦搜立、人聲如沸以躯。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,286評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)忧设。三九已至,卻和暖如春颠通,著一層夾襖步出監(jiān)牢的瞬間址晕,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,512評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工蒜哀, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留斩箫,地道東北人吏砂。 一個(gè)月前我還...
    沈念sama閱讀 45,536評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像乘客,于是被迫代替她去往敵國(guó)和親狐血。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,828評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容