OrthoFinder2—同源蛋白家族聚類

? ? ? ? 尋找同源蛋白家族用的比較多的是Orthomcl疲恢,但是該軟件多年前已經(jīng)停止更新遇八,且使用的時(shí)候需要安裝和使用MySQL,操作起來比較繁瑣读规。因此OrthoFinder應(yīng)運(yùn)而生怕敬,并且更新到版本2。后者不但可以尋找同源家族桑驱,并且可以構(gòu)建基因家族進(jìn)化樹押框。

1.?OrthoFinder及依賴包的安裝

下載

wget?https://github.com/davidemms/OrthoFinder/releases/download/v2.2.7/OrthoFinder-2.2.7.tar.gz

解壓

tar zxvf?OrthoFinder-2.2.7.tar.gz

安裝(加入環(huán)境變量即可)

vim ~/.bashrc

i

export PATH=$PATH:$HOME/tools/OrthoFinder-2.2.7

Esc

shift + ;

wq!

source?~/.bashrc

依賴包

(1)DIAMOND

Available here: https://github.com/bbuchfink/diamond/releases

? ? ? ? 下載對(duì)應(yīng)版本,解壓并將主程序拷貝至存在于環(huán)境變量的目錄下或?qū)⑵渌诘哪夸浖尤氕h(huán)境變量:

wget https://github.com/bbuchfink/diamond/releases/download/v0.9.24/diamond-linux64.tar.gz

tar xzf diamond-linux64.tar.gz

sudo cp diamond /usr/local/bin

沒有root權(quán)限的可以把diamond所在目錄加入環(huán)境變量肋联。

(2) MMseqs2

Available here: https://github.com/soedinglab/MMseqs2/releases

? ? ? ? 下載對(duì)應(yīng)版本鼎天,解壓并將主程序拷貝至存在于環(huán)境變量的目錄下或?qū)⑵渌诘哪夸浖尤氕h(huán)境變量:

wget https://github.com/soedinglab/MMseqs2/releases/download/7-4e23d/MMseqs2-Linux-AVX2.tar.gz

tar xzf MMseqs2-Linux-AVX2.tar.gz

sudo cp mmseqs2/bin/mmseqs /usr/local/bin

(3) MCL

Ubuntu, Debian, Linux Mint安裝方法:

sudo apt-get install mcl

Centos, Redhat安裝方法:

wget https://micans.org/mcl/src/mcl-latest.tar.gz

tar zxvf mcl-latest.tar.gz

cd mcl-14-137(視具體情況而定)

./configure

make

make check

sudo make install

(4) FastME

? ? ? ? 下載二進(jìn)制文件,解壓并將主程序拷貝至存在于環(huán)境變量的目錄下或?qū)⑵渌诘哪夸浖尤氕h(huán)境變量:

wget?http://www.atgc-montpellier.fr/download/sources/fastme/fastme-2.1.5.tar.gz

tar zxvf?fastme-2.1.5.tar.gz

sudo cp fastme-2.1.5/binaries/fastme-2.1.5-linux64 /usr/local/bin/fastme

(5) 可選: BLAST+

Ubuntu, Debian, Linux Mint安裝方法:

sudo apt-get install ncbi-blast+

Centos, Redhat安裝方法:

wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.8.1+-x64-linux.tar.gz

tar zxvf ncbi-blast-2.8.1+-x64-linux.tar.gz

vim ~/.bashrc

i

export PATH=$PATH:$HOME/tools/ncbi-blast-2.8.1+/bin

Esc

shift + ;

wq!

source ~/.bashrc


2. 運(yùn)行 OrthoFinder

(1) 運(yùn)行示例數(shù)據(jù):

cd OrthoFinder-2.2.7

orthofinder -f ExampleData

運(yùn)行結(jié)果如下烧颖,會(huì)顯示輸出文件的路徑涂圆,表明運(yùn)行成功:

示例數(shù)據(jù)運(yùn)行結(jié)果

(2) 運(yùn)行自己的數(shù)據(jù):

step1:數(shù)據(jù)準(zhǔn)備

? ? ? ? 下載氨基酸序列,要求為fasta格式,每個(gè)物種一個(gè)文件宴树。將所有fasta文件存于一個(gè)目錄中(如Data目錄)锭吨,如下圖所示塞帐。文件名要簡(jiǎn)潔并有區(qū)分性赎瞎,因?yàn)槲募麜?huì)作為最終的物種ID牌里。

目錄結(jié)構(gòu)與文件準(zhǔn)備

step2:運(yùn)行程序

在Data目錄的上一級(jí)目錄打開終端,運(yùn)行如下命令:

orthofinder -f Data -t 線程數(shù)



3. 結(jié)果解讀

(1) Results Files: Orthogroups

包含一個(gè)主文件“Orthogroups.csv”和兩個(gè)支持文件:

Orthogroups.csv务甥,每一行為一個(gè)group牡辽,每一列為一個(gè)物種,行列交匯處為基因名稱敞临。

Orthogroups_UnassignedGenes.csv态辛,包含所有未分配到任何group的基因名稱。

Orthogroups.txt挺尿,OrthoMCL格式的輸出結(jié)果奏黑,內(nèi)容等同于Orthogroups.csv炊邦。

(2)Results Files: Orthogroup Statistics

包含一些統(tǒng)計(jì)數(shù)據(jù),可用于比較基因組分析熟史、繪圖以及質(zhì)控馁害。

Statistics_Overall.csvStatistics_PerSpecies.csv,提供基本的描述信息

Orthogroups_SpeciesOverlaps.csv蹂匹,兩兩物種的group共享矩陣

- Species-specific orthogroup:該group僅包含一個(gè)物種的基因碘菜。

- G50:group中的基因數(shù),使得50%的基因處于該大小或更大的group中限寞。

- O50:最小數(shù)量的group忍啸,使得50%的基因處于該大小或更大的group中。

- Single-copy orthogroup:每個(gè)物種中只有一個(gè)基因的group(相當(dāng)于單拷貝核心基因)履植。這些group是構(gòu)建物種樹和許多其他分析的理想選擇计雌。

- Unassigned gene:未與任何其他基因劃分到一個(gè)group的基因。

(3)?Results Files: Orthologues

? ? ? ? 兩兩物種間的直系同源基因玫霎,每一行為一個(gè)group凿滤,第一列為group編號(hào),第二列為第一個(gè)物種的基因鼠渺,第三列為第二個(gè)物種的基因鸭巴。同一物種的基因名以“,”分割。直向同源物可以是一對(duì)一拦盹,一對(duì)多或多對(duì)多鹃祖。

(4)?Results Files: Gene Trees and Species Tree

? ? ? ? 每個(gè)group的基因樹和定根的物種樹以newick格式輸出,可以用各種看樹軟件展示普舆,如MEGA恬口、iTOLDendroscopeFigTree等沼侣,個(gè)人推薦用iTOL祖能。


4. 高級(jí)用法

(1)添加新物種到之前的分析(previous_orthofinder_directory指的是包含“SpeciesIDs.txt”的目錄)

orthofinder -b previous_orthofinder_directory -f new_fasta_directory

(2)從之前的分析中移除物種

從輸出目錄下找到工作目錄“WorkingDirectory”中的“SpeciesIDs.txt”文件,在要移除的物種那一行最前面加上一個(gè)“#”并保存蛾洛,然后運(yùn)行(previous_orthofinder_directory指的是包含“SpeciesIDs.txt”的目錄):

orthofinder -b previous_orthofinder_directory

(3)同時(shí)添加和刪除物種

編輯好“SpeciesIDs.txt”后养铸,運(yùn)行:

orthofinder -b previous_orthofinder_directory -f new_fasta_directory

(4)更多高級(jí)功能請(qǐng)閱讀官方文檔,主要包括“Inferring MSA Gene Trees”轧膘、并行計(jì)算钞螟、單獨(dú)運(yùn)行BLAST、使用預(yù)先計(jì)算的BLAST結(jié)果以及回歸檢測(cè)谎碍。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末鳞滨,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子蟆淀,更是在濱河造成了極大的恐慌拯啦,老刑警劉巖澡匪,帶你破解...
    沈念sama閱讀 216,402評(píng)論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異褒链,居然都是意外死亡唁情,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門碱蒙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來荠瘪,“玉大人,你說我怎么就攤上這事赛惩。” “怎么了趁餐?”我有些...
    開封第一講書人閱讀 162,483評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵喷兼,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我后雷,道長(zhǎng)季惯,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,165評(píng)論 1 292
  • 正文 為了忘掉前任臀突,我火速辦了婚禮勉抓,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘候学。我一直安慰自己藕筋,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評(píng)論 6 388
  • 文/花漫 我一把揭開白布梳码。 她就那樣靜靜地躺著隐圾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪掰茶。 梳的紋絲不亂的頭發(fā)上暇藏,一...
    開封第一講書人閱讀 51,146評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音濒蒋,去河邊找鬼盐碱。 笑死,一個(gè)胖子當(dāng)著我的面吹牛沪伙,可吹牛的內(nèi)容都是我干的瓮顽。 我是一名探鬼主播,決...
    沈念sama閱讀 40,032評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼焰坪,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼趣倾!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起某饰,我...
    開封第一講書人閱讀 38,896評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤儒恋,失蹤者是張志新(化名)和其女友劉穎善绎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體诫尽,經(jīng)...
    沈念sama閱讀 45,311評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡禀酱,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了牧嫉。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片剂跟。...
    茶點(diǎn)故事閱讀 39,696評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖酣藻,靈堂內(nèi)的尸體忽然破棺而出曹洽,到底是詐尸還是另有隱情,我是刑警寧澤辽剧,帶...
    沈念sama閱讀 35,413評(píng)論 5 343
  • 正文 年R本政府宣布送淆,位于F島的核電站,受9級(jí)特大地震影響怕轿,放射性物質(zhì)發(fā)生泄漏偷崩。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評(píng)論 3 325
  • 文/蒙蒙 一撞羽、第九天 我趴在偏房一處隱蔽的房頂上張望阐斜。 院中可真熱鬧,春花似錦诀紊、人聲如沸谒出。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽到推。三九已至,卻和暖如春惕澎,著一層夾襖步出監(jiān)牢的瞬間莉测,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工唧喉, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留捣卤,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,698評(píng)論 2 368
  • 正文 我出身青樓八孝,卻偏偏與公主長(zhǎng)得像董朝,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子干跛,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容