跟著Bioinformatics學(xué)數(shù)據(jù)分析:StainedGlass可視化展示基因組水平上的tandem repeat

論文

StainedGlass: interactive visualization of massive tandem repeat structures with identity heatmaps

代碼鏈接

https://mrvollger.github.io/StainedGlass/

https://github.com/mrvollger/StainedGlass

這個工具是用來可視化展示基因組水平上tandem repeat 的相似性,是用snakemake搭建的一個流程锯蛀,今天的推文我們試著拆解一下這個流程里都有哪些步驟

這個流程依賴的軟件是通過搭配conda配置文件的方式去安裝灭衷,但是在集群上的計算節(jié)點很多時候是不能聯(lián)網(wǎng)的,所以最好還是提前配置好依賴軟件旁涤,依賴的軟件在 workflow/env目錄下的env.yaml和R.yaml下

  - pandas
  - numpy
  - numba
  - cooler
  - minimap2==2.18
  - bedtools
  - samtools>=1.9
  - pysam
  - snakemake>=7.8
  - snakefmt
  - bwa
  - pigz 
  - xorg-libx11
  - xorg-libxau
  - r-base>=4.0
  - r-essentials
  - r-cairo
  - r::r-tidyverse
  - r-data.table
  - r-cowplot
  - r-argparse>=2.1.2
  - r-glue
  - r::r-rcolorbrewer
  - r::r-scales
  - r::r-ggplot2
  - r-r.utils

把依賴的軟件和R包都安裝一下

運行命令

snakemake -s ~/biotools/StainedGlass/workflow/Snakefile --configfile=/home/myan/biotools/StainedGlass/config/config.yaml --config sample=A fasta=/data/myan/raw_data/practice/stainedGlass/chr8_cen.fasta --cores 8 make_figures -pn

會展示出這個流程每一步具體執(zhí)行的命令翔曲,然后我們分別執(zhí)行其中的命令看看每一步具體做了什么事

首先是對輸入數(shù)據(jù)進(jìn)行索引

samtools faidx chr1.fa

bedtools利用fai文件生成bed文件

## -s 參數(shù)可以設(shè)置滑窗 -w設(shè)置的是步長
bedtools makewindows -g chr1.fa.fai -w 2000 > output.bed

bedtools根據(jù)bed文件分隔fasta文件

bedtools getfasta -fi chr1.fa -bed output.bed > output.2000.fasta

batch_bed_files.py 這個腳本的作用好像是把bed文件進(jìn)行分隔,--outputs參數(shù)后好像可以自定義寫多少個輸出

python ../batch_bed_files.py output.bed --outputs a0.bed a1.bed a2.bed

這一步是對參考構(gòu)建數(shù)據(jù)庫

minimap2 -f 1000 -s 400 -ax ava-ont -d output.fasta.mmi output.2000.fasta

這里的-f和-s參數(shù)沒看懂是什么意思

minimap2的幫助文檔

image.png

根據(jù)分隔的bed文件分別提取fasta序列

bedtools getfasta -fi chr1.fa -bed a0.bed > a0.fa
bedtools getfasta -fi chr1.fa -bed a1.bed > a1.fa
bedtools getfasta -fi chr1.fa -bed a2.bed > a2.fa

minimap2比對生成bam文件并合并

minimap2 -t 4 -f 10000 -s 400 -ax ava-ont --dual=yes --eqx output.fasta.mmi a0.fa | samtools sort -m 4G -o a0.bam
minimap2 -t 4 -f 10000 -s 400 -ax ava-ont --dual=yes --eqx output.fasta.mmi a1.fa | samtools sort -m 4G -o a1.bam
minimap2 -t 4 -f 10000 -s 400 -ax ava-ont --dual=yes --eqx output.fasta.mmi a2.fa | samtools sort -m 4G -o a2.bam

samtools merge -@ 4 -O BAM merged.bam a0.bam a1.bam a2.bam
samtools index merged.bam

接下來是畫圖劈愚,這里的兩個python腳本起到了什么作用暫時還不太明白

python samIdentity.py --threads 8 --matches 400 --header merged.bam > output.tbl

bgzip -c output.tbl > output.tbl.gz

python refmt.py --window 2000 --fai chr1.fa.fai --full output.full.tbl.gz output.tbl.gz full.bed.gz

mkdir -p results/abc_figures/pdfs
mkdir -p results/abc_figures/pngs

Rscript aln_plot.R -b full.bed.gz --threads 8 --prefix abc

輸出的部分結(jié)果

image.png
image.png

這個是論文中提供的圖

image.png

推文記錄的是自己的學(xué)習(xí)筆記瞳遍,很可能存在錯誤,請大家批判著看

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末菌羽,一起剝皮案震驚了整個濱河市掠械,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌注祖,老刑警劉巖猾蒂,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異是晨,居然都是意外死亡肚菠,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進(jìn)店門罩缴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蚊逢,“玉大人,你說我怎么就攤上這事靴庆。” “怎么了怒医?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵炉抒,是天一觀的道長。 經(jīng)常有香客問我稚叹,道長焰薄,這世上最難降的妖魔是什么拿诸? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮塞茅,結(jié)果婚禮上亩码,老公的妹妹穿的比我還像新娘。我一直安慰自己野瘦,他們只是感情好描沟,可當(dāng)我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著鞭光,像睡著了一般吏廉。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上惰许,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天席覆,我揣著相機(jī)與錄音,去河邊找鬼汹买。 笑死佩伤,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的晦毙。 我是一名探鬼主播生巡,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼结序!你這毒婦竟也來了障斋?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤徐鹤,失蹤者是張志新(化名)和其女友劉穎垃环,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體返敬,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡遂庄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了劲赠。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片涛目。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖凛澎,靈堂內(nèi)的尸體忽然破棺而出霹肝,到底是詐尸還是另有隱情,我是刑警寧澤塑煎,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布沫换,位于F島的核電站,受9級特大地震影響最铁,放射性物質(zhì)發(fā)生泄漏讯赏。R本人自食惡果不足惜垮兑,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望漱挎。 院中可真熱鬧系枪,春花似錦、人聲如沸磕谅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽怜庸。三九已至当犯,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間割疾,已是汗流浹背嚎卫。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留宏榕,地道東北人拓诸。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像麻昼,于是被迫代替她去往敵國和親奠支。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容