scTE -10X Genomic RNA-seq 定量Transposable Element

關鍵詞：Transposable Element；ERV內(nèi)源性反轉(zhuǎn)錄病毒裂七；單細胞測序分析唬格；Seurat家破；scTE。

scTE介紹

背景：

采用scTE對10X 單細胞測序數(shù)據(jù)進行TE定量购岗，再倒入Seurat進行下游分析汰聋。Jiekai 實驗室，2021年3月發(fā)表在自然通訊雜志藕畔。
轉(zhuǎn)座因子 (Transposable Element马僻，TE) 占典型真核生物基因組的大部分庄拇，并以不清楚的方式導致細胞異質(zhì)性注服。單細胞測序技術是探索細胞的強大工具，但分析通常以基因為中心措近，并且尚未解決 TE 表達問題溶弟。

方法：

1. 安裝scTE

# scTE works with python >=3.6.
$ git clone https://github.com/JiekaiLab/scTE.git ## 進入你想要下載scTE的文件夾。
$ cd scTE
$ python setup.py install ## 進行安裝

# Building genome indices
$ scTE_build -g mm10 # Mouse
$ scTE_build -g hg38 # Human

2. 對10x的輸出結(jié)果bam文件進行scTE分析瞭郑。

$ scTE -i ../run_cellranger_count/run_count_YL002273_S2/outs/possorted_genome_bam.bam -o YL002272_S2 -x /home/ye.liu/yang-secondary/ye/biotools/scTE/mm10.exclusive.idx --hdf5 True -CB CR -UMI UB

--hdf5 True 結(jié)果輸出是hdf5格式辜御。如果用Seurat進行下游分析需要轉(zhuǎn)換為Seurat object。
-CB cell barcode屈张，要確認bam文件中你的cell barcode的標簽是CR還是CB擒权。如果是CR就-CB CR,如果是CB就-CB CB。

查看示例bam阁谆，倒數(shù)第四列是CB：

$ samtools view test.bam
A00519:758:HTCCHDSXY:3:2535:21296:19774 16  chr1    14021   0   90M *   0   0   TGGATTTCTATCTCCCTGGCTTGGTGCCAGTTCCTCCAAGTCGATGGCACCTCCCTCCCTCTCAACCACTTGAGCAAACTCCAAGACATC  ,FFFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:F:FFFFFFFFFFFFFFFFFFF:FFFFF  NH:i:5  HI:i:1  AS:i:88 nM:i:0  RG:Z:SC3_v3_NextGem_DI_CellPlex_Human_PBMC_10K:0:1:HTCCHDSXY:3  RE:A:I  xf:i:0  CR:Z:CTCCCTCCACTGCGAC   CY:Z:FFFFFFFFFFFFFFFF   CB:Z:CTCCCTCCACTGCGAC-1 UR:Z:AAGGCGTAGTAG   UY:Z:FFFFFFFFFFFF   UB:Z:AAGGCGTAGTAG
A00519:758:HTCCHDSXY:1:1355:17237:31720 0   chr1    14260   0   90M *   0   0   CTCCCTCTCATCCCAGAGAAACAGGTCAGCTGGGAGCTTCTGCCCCCACTGCCTAGGGACCAACAGGGGCAGGAGGCAGTCACTGACCCC  FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF  NH:i:5  HI:i:1  AS:i:88 nM:i:0  RG:Z:SC3_v3_NextGem_DI_CellPlex_Human_PBMC_10K:0:1:HTCCHDSXY:1  RE:A:I  xf:i:0  CR:Z:TCGTCCACAGTATGAA   CY:Z:FFFFFFFFFFFFFFFF   CB:Z:TCGTCCACAGTATGAA-1 UR:Z:GACTTATTTTTT   UY:Z:FFFFFFFFFFFF   UB:Z:GACTTATTTTTT
A00519:758:HTCCHDSXY:3:2227:16703:32080 16  chr1    14411   1   90M *   0   0   TCAGTTCTTTATTGATTGGTGTGCCGTTTTCTCTGGAAGCCTCTTAAGAACACAGTGGCGCAGGCTGGGTGGAGCCGTCCCCCCATGGAG  FFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFF:FFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF  NH:i:3  HI:i:1  AS:i:88 nM:i:0  RG:Z:SC3_v3_NextGem_DI_CellPlex_Human_PBMC_10K:0:1:HTCCHDSXY:3  RE:A:I  xf:i:0  CR:Z:TTGAGTGGTTGTGGCC   CY:Z:FFFFFFFFFFFFFFFF   CB:Z:TTGAGTGGTTGTGGCC-1 UR:Z:TATAATGCTCAG   UY:Z:FFFFFFFFFFFF   UB:Z:TATAATGCTCAG
A00519:758:HTCCHDSXY:3:2563:23665:33802 16  chr1    14411   1   90M *   0   0   TCAGTTCTTTATTGATTGGTGTGCCGTTTTCTCTGGAAGCCTCTTAAGAACACAGTGGCGCAGGCTGGGTGGAGCCGTCCCCCCATGGAG  FFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF  NH:i:3  HI:i:1  AS:i:88 nM:i:0  RG:Z:SC3_v3_NextGem_DI_CellPlex_Human_PBMC_10K:0:1:HTCCHDSXY:3  RE:A:I  xf:i:0  CR:Z:TGTTGAGAGGCAATGC   CY:Z:FFFFFFFFFFFFFFFF   CB:Z:TGTTGAGAGGCAATGC-1 UR:Z:ACGGGTGTGGAG   UY:Z:FFFFFFFFFFFF   UB:Z:ACGGGTGTGGAG

3. hdf5 轉(zhuǎn)化成Seurat object

使用Convert（）進行轉(zhuǎn)換碳抄。
using the function Convert from SeuratDisk.

# R
library(SeuratDisk)
library(Seurat)
# 轉(zhuǎn)換為h5seurat 文件
Convert("../../../YL002272_S1.h5ad", dest = "h5seurat", overwrite = TRUE)

# 再將其導入R
Seurat.obj <- LoadH5Seurat("../../../YL002272_S1.h5seurat")

將count matrix中的gene 和 TE分開

# R
## load TE names
te = read.csv('../data/mm10.TEname.txt', sep = '\t', header = F)
##
Gene = subset(Seurat.obj, features = rownames(Seurat.obj)[!rownames(Seurat.obj) %in% te$V1])
TEs = subset(Seurat.obj, features = rownames(Seurat.obj)[rownames(Seurat.obj) %in% te$V1])

TEs可以進行Seurat對應的分析。

如何下載mm10.TEname.txt文件

# hg38
$ wget -c http://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/rmsk.txt.gz -O hg38.te.txt
$ zcat hg38.te.txt | grep -E 'LINE|SINE|LTR|DNA|Retroposon' | cut -f 11 | sort | uniq > hg38.TEname.txt

# mm10
wget -c http://hgdownload.soe.ucsc.edu/goldenPath/mm10/database/rmsk.txt.gz -O mm10.te.txt
zcat mm10.te.txt | grep -E 'LINE|SINE|LTR|DNA|Retroposon' | cut -f 11 | sort | uniq > mm10.TEname.txt

# if you need to know the family and class info for the TE names
zcat hg38.te.txt | grep -E 'LINE|SINE|LTR|DNA|Retroposon' | cut -f 11,12,13 | sort | uniq > hg38.TEnamefamilyclass.txt
zcat mm10.te.txt | grep -E 'LINE|SINE|LTR|DNA|Retroposon' | cut -f 11,12,13 | sort | uniq > mm10.TEnamefamilyclass.txt

### Note: check this page https://github.com/jphe/scTE/issues/3

參考文獻：

https://github.com/JiekaiLab/scTE
https://www.nature.com/articles/s41467-021-21808-x

最后編輯于：2021.10.28 03:46:25

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末场绿，一起剝皮案震驚了整個濱河市剖效，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖璧尸，帶你破解...
沈念sama閱讀 206,013評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件咒林，死亡現(xiàn)場離奇詭異，居然都是意外死亡爷光，警方通過查閱死者的電腦和手機垫竞，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,205評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來瞎颗，“玉大人件甥，你說我怎么就攤上這事『甙危” “怎么了引有？”我有些...
開封第一講書人閱讀 152,370評論 0贊 342
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長倦逐。經(jīng)常有香客問我譬正，道長，這世上最難降的妖魔是什么檬姥？我笑而不...
開封第一講書人閱讀 55,168評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任曾我，我火速辦了婚禮，結(jié)果婚禮上健民，老公的妹妹穿的比我還像新娘抒巢。我一直安慰自己，他們只是感情好秉犹，可當我...
茶點故事閱讀 64,153評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布蛉谜。她就那樣靜靜地躺著，像睡著了一般崇堵。火紅的嫁衣襯著肌膚如雪型诚。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 48,954評論 1贊 283
城市分裂傳說
那天鸳劳，我揣著相機與錄音狰贯，去河邊找鬼。笑死赏廓，一個胖子當著我的面吹牛涵紊，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播幔摸，決...
沈念sama閱讀 38,271評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼摸柄，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了抚太？” 一聲冷哼從身側(cè)響起塘幅，我...
開封第一講書人閱讀 36,916評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤昔案，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后电媳，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體踏揣，經(jīng)...
沈念sama閱讀 43,382評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,877評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年匾乓，在試婚紗的時候發(fā)現(xiàn)自己被綠了捞稿。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 37,989評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡拼缝，死狀恐怖娱局，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情咧七，我是刑警寧澤衰齐，帶...
沈念sama閱讀 33,624評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站继阻，受9級特大地震影響耻涛，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜瘟檩，卻給世界環(huán)境...
茶點故事閱讀 39,209評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一抹缕、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧墨辛，春花似錦卓研、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,199評論 0贊 19
一樁弒父案奏赘，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至带膀，卻和暖如春志珍，著一層夾襖步出監(jiān)牢的瞬間橙垢，已是汗流浹背垛叨。一陣腳步聲響...
開封第一講書人閱讀 31,418評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留柜某，地道東北人嗽元。一個月前我還...
沈念sama閱讀 45,401評論 2贊 352
代替公主和親
正文我出身青樓，卻偏偏與公主長得像喂击，于是被迫代替她去往敵國和親剂癌。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 42,700評論 2贊 345

scTE -10X Genomic RNA-seq 定量Transposable Element

背景：

方法：

1. 安裝scTE

2. 對10x的輸出結(jié)果bam文件進行scTE分析瞭郑。

3. hdf5 轉(zhuǎn)化成Seurat object

參考文獻：

推薦閱讀更多精彩內(nèi)容