MCScanX-transposed安裝及使用

1.簡介

(1)MCScanX-transposed是基于在相關(guān)基因組內(nèi)和相互之間應(yīng)用MCScanX曹宴,能夠檢測不同時(shí)期內(nèi)發(fā)生的轉(zhuǎn)座基因復(fù)制的軟件包镣典,也有助于基因復(fù)制模式的綜合分析和用基因復(fù)制模式注釋感興趣的基因家族鸳玩。
MCScanX是用于檢測和進(jìn)化分析基因同源性和共線性的工具包俏脊,而MCScanX-transposed是用于檢測不同時(shí)期內(nèi)發(fā)生的轉(zhuǎn)座基因復(fù)制以及基因復(fù)制模式的綜合分析的軟件包艘包,參看MCScanX-tansposed's manual统倒。

(2)發(fā)表文章:Wang Y, Li J, Paterson AH. (2013) MCScanX-transposed: detecting transposed gene duplications based on multiple colinearity scans. Bioinformatics, doi: 10.1093/bioinformatics/btt150.

2.安裝

wget http://chibba.pgml.uga.edu/mcscan2/transposed/MCScanX-transposed.zip
unzip MCScanX-transposed.zip
cd MCScanX-transposed
make
解壓以后包括以下程序:
Snipaste_2019-03-12_20-12-49.png

3.利用測試文件寨典,了解方法

注意:

? 解壓安裝以后有個(gè)data文件夾,里面有At測試數(shù)據(jù)房匆,
? -i 后面必須要接文件夾名不能用 ./耸成,指定輸出文件夾名./data
? 準(zhǔn)備的數(shù)據(jù)必須在MCScanX-transpose文件夾下,否則報(bào)錯(cuò)

perl ~/biosoft/MCScanX-transposed/MCScanX-transposed.pl -i ./data -t at -c al,br,cp,pt,vv -o result/at_result
結(jié)果如圖:

生成15個(gè)結(jié)果文件浴鸿,主要有8個(gè):


1.png

2.png

4.核心程序 MCScanX-transposed.pl

使用前需要準(zhǔn)備文件:
注意:

1.由于不方便演示自己的準(zhǔn)備的文件井氢,還是以官網(wǎng)測試數(shù)據(jù)為例,若自己要準(zhǔn)備文件岳链,即替換擬南芥為自己研究的物種花竞,其他的物種可以選擇自己關(guān)心的物種。
2.不用測試文件掸哑,用自己的文件容易被坑约急,因?yàn)椴恢澜Y(jié)果是什么(我就是被坑慘啦)零远。

(1)準(zhǔn)備文件:
3.png
重要:使用者必須通過仔細(xì)閱讀下列說明(1-4)準(zhǔn)備輸入文件。
  1. All input files should be stored under ONE folder(the "data_directory" parameter)
  2. For the target genome in which gene duplicaiton modes will be classified, please prepare two input files:
    a) "[target_species].gff", a gene position file for the target species, following a tab-delimited format: "sp&chr_NO gene starting_position ending_position"
    b) "[target_species].blast", a blastp output file (m8 format) for the target species (self-genome comparison).
  3. For each outgroup genome, please prepare two input files:
    a) "[target_species][outgroup_species].gff", a gene position file for the target_species and outgroup_species, following a tab-delimited format:"sp&chr_NO gene starting_position ending_position"
    b) "[target_species]
    [outgroup_species].blast", a blastp output file (m8 format) between the target and outgroup species (cross-genome comparison).
  4. For example, assuming that you are going to classify gene duplication modes in Arabidopsis thaliana (ID: at), using Brassica rapa (ID: br) and Carica papaya (ID: cp) as outgroups, you need to prepare 6 input files: "at.gff","at.blast", "at_br.gff", "at_br.blast","at_br.gff","at_cp.gff" and "at_cp.blast".
(2)建庫

以at_vv.gff文件為例厌蔽,其他準(zhǔn)備相同:

cat at.gff vv.gff >at_vv.gff
makeblastdb -in at_vv.pep -dbtype prot -parse_seqids -out at_vv.db
blastp -query at_vv.pep -db at_vv.db -out at_vv.blast -evalue 1e-10 -num_threads 20 -outfmt 6 -num_alignments 5

at_vv.blast文件:
1.官網(wǎng)at_vv.blast 包括2種結(jié)果:at-vv牵辣、vv-at(我自己分析at-at、vv-vv結(jié)果不去掉奴饮,好像就是程序運(yùn)行慢纬向,讀取過程也會(huì)自動(dòng)去掉)。
2.多個(gè)轉(zhuǎn)錄本存在時(shí)戴卜,選擇最長轉(zhuǎn)錄本逾条。使用命令行/腳本或者軟件TBtools的Fasta Longest Representive功能。
3.多個(gè)物種建庫blastp命令進(jìn)行封裝叉瘩。

(3)分類提取結(jié)果

Classify gene duplication modes in A. thaliana, using A. lyrata, Brassica rapa, Carica papaya, Populus trichocarpa and Vitis vinifera as outgroups and specifying three epochs to be identified, by the command:

1)同上第三點(diǎn)3的命令和結(jié)果:
perl MCScanX-transposed.pl -i data -t at -c al,br,cp,pt,vv -o result/at_result
Snipaste_2019-03-12_20-08-22.png
2)加上-x 3的結(jié)果膳帕,自己與上面比對(duì):
perl MCScanX-transposed.pl -i data -t at -c al,br,cp,pt,vv -o result/at_result -x 3

Snipaste_2019-03-12_20-06-40.png

5.下游分析程序(僅介紹前三種)

Tool 1. add_ka_ks.pl

Tool 2. detect_dup_modes_for_a_gene.pl

Tool 3. detect_dup_modes_for_a_family.pl

Tool 4. annotate_tree_with_dup_mode

Tool 5. annotate_tree_with_tra_dup

(1)add_ka_ks.pl(需要Bioperl)
perl add_ka_ks.pl -d data/at.cds -i result/at_result/at.transposed_after_al.pairs -o result/at.transposed_after_al.pairs.kaks
(2)detect_dup_modes_for_a_family.pl

mads.genes文件: gene ID以tab鍵分隔

perl detect_dup_modes_for_a_family.pl -i data/mads.genes -d result/at_result/at -o result/mads.duplication.modes

注意:
結(jié)果有包含轉(zhuǎn)座基因~


dup.png
(3)detect_dup_modes_for_a_gene.pl
perl detect_dup_modes_for_a_family.pl -i data/mads.genes -d result/test1/at -o result/mads.dup
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末粘捎,一起剝皮案震驚了整個(gè)濱河市薇缅,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌攒磨,老刑警劉巖泳桦,帶你破解...
    沈念sama閱讀 221,695評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異娩缰,居然都是意外死亡灸撰,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門拼坎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來浮毯,“玉大人,你說我怎么就攤上這事泰鸡≌叮” “怎么了?”我有些...
    開封第一講書人閱讀 168,130評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵盛龄,是天一觀的道長饰迹。 經(jīng)常有香客問我,道長余舶,這世上最難降的妖魔是什么啊鸭? 我笑而不...
    開封第一講書人閱讀 59,648評(píng)論 1 297
  • 正文 為了忘掉前任,我火速辦了婚禮匿值,結(jié)果婚禮上赠制,老公的妹妹穿的比我還像新娘。我一直安慰自己挟憔,他們只是感情好憎妙,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,655評(píng)論 6 397
  • 文/花漫 我一把揭開白布库正。 她就那樣靜靜地躺著,像睡著了一般厘唾。 火紅的嫁衣襯著肌膚如雪褥符。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,268評(píng)論 1 309
  • 那天抚垃,我揣著相機(jī)與錄音喷楣,去河邊找鬼。 笑死鹤树,一個(gè)胖子當(dāng)著我的面吹牛铣焊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播罕伯,決...
    沈念sama閱讀 40,835評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼曲伊,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了追他?” 一聲冷哼從身側(cè)響起坟募,我...
    開封第一講書人閱讀 39,740評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎邑狸,沒想到半個(gè)月后懈糯,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,286評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡单雾,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,375評(píng)論 3 340
  • 正文 我和宋清朗相戀三年赚哗,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片硅堆。...
    茶點(diǎn)故事閱讀 40,505評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡屿储,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出渐逃,到底是詐尸還是另有隱情够掠,我是刑警寧澤,帶...
    沈念sama閱讀 36,185評(píng)論 5 350
  • 正文 年R本政府宣布朴乖,位于F島的核電站祖屏,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏买羞。R本人自食惡果不足惜袁勺,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,873評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望畜普。 院中可真熱鬧期丰,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,357評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至埠通,卻和暖如春赎离,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背端辱。 一陣腳步聲響...
    開封第一講書人閱讀 33,466評(píng)論 1 272
  • 我被黑心中介騙來泰國打工梁剔, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人舞蔽。 一個(gè)月前我還...
    沈念sama閱讀 48,921評(píng)論 3 376
  • 正文 我出身青樓荣病,卻偏偏與公主長得像,于是被迫代替她去往敵國和親渗柿。 傳聞我的和親對(duì)象是個(gè)殘疾皇子个盆,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,515評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • 一颊亮、什么是解釋 當(dāng)我們編寫Python代碼時(shí),我們得到的是一個(gè)包含Python代碼的以.py為擴(kuò)展名的文本文件混槐。要...
    唯老閱讀 701評(píng)論 1 7
  • MaxTZ閱讀 146評(píng)論 0 1
  • 表示傾向的有三種說法:「~傾向がある」编兄、「~嫌いがある」和「~一方だ」 最簡單的就是「~傾向(けいこう)がある」轩性,...
    RencaiXiong閱讀 687評(píng)論 0 1