scTE -10X Genomic RNA-seq 定量Transposable Element

關鍵詞:Transposable Element;ERV內(nèi)源性反轉(zhuǎn)錄病毒裂七;單細胞測序分析唬格;Seurat家破;scTE。


scTE介紹

背景:

采用scTE對10X 單細胞測序數(shù)據(jù)進行TE定量购岗,再倒入Seurat進行下游分析汰聋。Jiekai 實驗室,2021年3月發(fā)表在自然通訊雜志藕畔。
轉(zhuǎn)座因子 (Transposable Element马僻,TE) 占典型真核生物基因組的大部分庄拇,并以不清楚的方式導致細胞異質(zhì)性注服。單細胞測序技術是探索細胞的強大工具,但分析通常以基因為中心措近,并且尚未解決 TE 表達問題溶弟。

方法:

1. 安裝scTE

# scTE works with python >=3.6.
$ git clone https://github.com/JiekaiLab/scTE.git ## 進入你想要下載scTE的文件夾。
$ cd scTE
$ python setup.py install ## 進行安裝

# Building genome indices
$ scTE_build -g mm10 # Mouse
$ scTE_build -g hg38 # Human

2. 對10x的輸出結(jié)果bam文件進行scTE分析瞭郑。

$ scTE -i ../run_cellranger_count/run_count_YL002273_S2/outs/possorted_genome_bam.bam -o YL002272_S2 -x /home/ye.liu/yang-secondary/ye/biotools/scTE/mm10.exclusive.idx --hdf5 True -CB CR -UMI UB

--hdf5 True 結(jié)果輸出是hdf5格式辜御。如果用Seurat進行下游分析需要轉(zhuǎn)換為Seurat object。
-CB cell barcode屈张,要確認bam文件中你的cell barcode的標簽是CR還是CB擒权。如果是CR就-CB CR,如果是CB就-CB CB

查看示例bam阁谆,倒數(shù)第四列是CB:

$ samtools view test.bam
A00519:758:HTCCHDSXY:3:2535:21296:19774 16  chr1    14021   0   90M *   0   0   TGGATTTCTATCTCCCTGGCTTGGTGCCAGTTCCTCCAAGTCGATGGCACCTCCCTCCCTCTCAACCACTTGAGCAAACTCCAAGACATC  ,FFFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:F:FFFFFFFFFFFFFFFFFFF:FFFFF  NH:i:5  HI:i:1  AS:i:88 nM:i:0  RG:Z:SC3_v3_NextGem_DI_CellPlex_Human_PBMC_10K:0:1:HTCCHDSXY:3  RE:A:I  xf:i:0  CR:Z:CTCCCTCCACTGCGAC   CY:Z:FFFFFFFFFFFFFFFF   CB:Z:CTCCCTCCACTGCGAC-1 UR:Z:AAGGCGTAGTAG   UY:Z:FFFFFFFFFFFF   UB:Z:AAGGCGTAGTAG
A00519:758:HTCCHDSXY:1:1355:17237:31720 0   chr1    14260   0   90M *   0   0   CTCCCTCTCATCCCAGAGAAACAGGTCAGCTGGGAGCTTCTGCCCCCACTGCCTAGGGACCAACAGGGGCAGGAGGCAGTCACTGACCCC  FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF  NH:i:5  HI:i:1  AS:i:88 nM:i:0  RG:Z:SC3_v3_NextGem_DI_CellPlex_Human_PBMC_10K:0:1:HTCCHDSXY:1  RE:A:I  xf:i:0  CR:Z:TCGTCCACAGTATGAA   CY:Z:FFFFFFFFFFFFFFFF   CB:Z:TCGTCCACAGTATGAA-1 UR:Z:GACTTATTTTTT   UY:Z:FFFFFFFFFFFF   UB:Z:GACTTATTTTTT
A00519:758:HTCCHDSXY:3:2227:16703:32080 16  chr1    14411   1   90M *   0   0   TCAGTTCTTTATTGATTGGTGTGCCGTTTTCTCTGGAAGCCTCTTAAGAACACAGTGGCGCAGGCTGGGTGGAGCCGTCCCCCCATGGAG  FFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFF:FFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF  NH:i:3  HI:i:1  AS:i:88 nM:i:0  RG:Z:SC3_v3_NextGem_DI_CellPlex_Human_PBMC_10K:0:1:HTCCHDSXY:3  RE:A:I  xf:i:0  CR:Z:TTGAGTGGTTGTGGCC   CY:Z:FFFFFFFFFFFFFFFF   CB:Z:TTGAGTGGTTGTGGCC-1 UR:Z:TATAATGCTCAG   UY:Z:FFFFFFFFFFFF   UB:Z:TATAATGCTCAG
A00519:758:HTCCHDSXY:3:2563:23665:33802 16  chr1    14411   1   90M *   0   0   TCAGTTCTTTATTGATTGGTGTGCCGTTTTCTCTGGAAGCCTCTTAAGAACACAGTGGCGCAGGCTGGGTGGAGCCGTCCCCCCATGGAG  FFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF  NH:i:3  HI:i:1  AS:i:88 nM:i:0  RG:Z:SC3_v3_NextGem_DI_CellPlex_Human_PBMC_10K:0:1:HTCCHDSXY:3  RE:A:I  xf:i:0  CR:Z:TGTTGAGAGGCAATGC   CY:Z:FFFFFFFFFFFFFFFF   CB:Z:TGTTGAGAGGCAATGC-1 UR:Z:ACGGGTGTGGAG   UY:Z:FFFFFFFFFFFF   UB:Z:ACGGGTGTGGAG

3. hdf5 轉(zhuǎn)化成Seurat object

使用Convert()進行轉(zhuǎn)換碳抄。
using the function Convert from SeuratDisk.

# R
library(SeuratDisk)
library(Seurat)
# 轉(zhuǎn)換為h5seurat 文件
Convert("../../../YL002272_S1.h5ad", dest = "h5seurat", overwrite = TRUE)

# 再將其導入R
Seurat.obj <- LoadH5Seurat("../../../YL002272_S1.h5seurat")

將count matrix中的gene 和 TE分開

# R
## load TE names
te = read.csv('../data/mm10.TEname.txt', sep = '\t', header = F)
##
Gene = subset(Seurat.obj, features = rownames(Seurat.obj)[!rownames(Seurat.obj) %in% te$V1])
TEs = subset(Seurat.obj, features = rownames(Seurat.obj)[rownames(Seurat.obj) %in% te$V1])

TEs可以進行Seurat對應的分析。

如何下載mm10.TEname.txt文件

# hg38
$ wget -c http://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/rmsk.txt.gz -O hg38.te.txt
$ zcat hg38.te.txt | grep -E 'LINE|SINE|LTR|DNA|Retroposon' | cut -f 11 | sort | uniq > hg38.TEname.txt

# mm10
wget -c http://hgdownload.soe.ucsc.edu/goldenPath/mm10/database/rmsk.txt.gz -O mm10.te.txt
zcat mm10.te.txt | grep -E 'LINE|SINE|LTR|DNA|Retroposon' | cut -f 11 | sort | uniq > mm10.TEname.txt

# if you need to know the family and class info for the TE names
zcat hg38.te.txt | grep -E 'LINE|SINE|LTR|DNA|Retroposon' | cut -f 11,12,13 | sort | uniq > hg38.TEnamefamilyclass.txt
zcat mm10.te.txt | grep -E 'LINE|SINE|LTR|DNA|Retroposon' | cut -f 11,12,13 | sort | uniq > mm10.TEnamefamilyclass.txt

### Note: check this page https://github.com/jphe/scTE/issues/3

參考文獻:

https://github.com/JiekaiLab/scTE
https://www.nature.com/articles/s41467-021-21808-x

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末场绿,一起剝皮案震驚了整個濱河市剖效,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖璧尸,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件咒林,死亡現(xiàn)場離奇詭異,居然都是意外死亡爷光,警方通過查閱死者的電腦和手機垫竞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來瞎颗,“玉大人件甥,你說我怎么就攤上這事『甙危” “怎么了引有?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長倦逐。 經(jīng)常有香客問我譬正,道長,這世上最難降的妖魔是什么檬姥? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任曾我,我火速辦了婚禮,結(jié)果婚禮上健民,老公的妹妹穿的比我還像新娘抒巢。我一直安慰自己,他們只是感情好秉犹,可當我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布蛉谜。 她就那樣靜靜地躺著,像睡著了一般崇堵。 火紅的嫁衣襯著肌膚如雪型诚。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天鸳劳,我揣著相機與錄音狰贯,去河邊找鬼。 笑死赏廓,一個胖子當著我的面吹牛涵紊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播幔摸,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼摸柄,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了抚太?” 一聲冷哼從身側(cè)響起塘幅,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤昔案,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后电媳,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體踏揣,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年匾乓,在試婚紗的時候發(fā)現(xiàn)自己被綠了捞稿。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡拼缝,死狀恐怖娱局,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情咧七,我是刑警寧澤衰齐,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站继阻,受9級特大地震影響耻涛,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜瘟檩,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一抹缕、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧墨辛,春花似錦卓研、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至带膀,卻和暖如春志珍,著一層夾襖步出監(jiān)牢的瞬間橙垢,已是汗流浹背垛叨。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留柜某,地道東北人嗽元。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像喂击,于是被迫代替她去往敵國和親剂癌。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容