Possvm安裝:
conda envcreate -n possvm --file environment.yaml
condaactivate possvm
不要自己安裝,因為有好多的依賴包
Possvm:充分利用Species overlap算法來解析系統(tǒng)發(fā)育關系和鑒定同源基因對龄坪,然后利用Mcl進行Orthologous groups的鑒定
輸入文件:僅需要一個Newick形式的基因樹文件-基因名的前綴要加上物種名
Possvm思想四步走:
*Possvm* works infour basic steps:
1. Identification oforthology pairs using Species Overlap, which are used to build an orthologygraph.
2. Obtain orthologyclusters from pairwise orthology relationships, using MCL clustering.
3. Produce parseabletables with orthogroups and ortholog pairs.
4. Orthogroups canbe annotated using names from reference member genes, in a phylogeny-awaremanner.
基因樹文件有沒有支持信息都可以
Possvm的各個參數(shù):
-i:系統(tǒng)發(fā)育樹的newick格式
-o:輸出文件夾
-p:輸出文件名稱的前綴
-s:species overlap域值算芯,float類型之众;默認為0旨剥,最大值為1茎辐,值越大同源群的包容性就越大
-method:聚類方法框杜;包括:mcl(默認)双炕、mclw(mcl weighted by node support)贾节、louvain或lpa(label propagation algotithm)-經(jīng)實踐該參數(shù)設定在0.7-0.9之間汁汗,即0.8較為合適(純屬個人經(jīng)驗)
-outgroup:定義一系列的物種集合,這些物種在系統(tǒng)發(fā)育關系中被作為外類群栗涂。物種間可以用逗號分割知牌,或者是一行一個物種。該選項不影響樹的置根斤程,僅用于orthology聚類角寸。默認是禁用的。
-split:基因名包括物種名+基因名忿墅,該參數(shù)指定物種名和基因名的分割符合扁藕,如_,默認是_
-itermidroot:整數(shù)疚脐;打開重疊中點置根法亿柑,被用于代替默認的中點置根法。推薦該參數(shù)設為10
-skiproot:布爾值亮曹;關閉對樹置根橄杨,在這種情況下一般是你的樹已經(jīng)有根
-printallpairs:布爾值秘症;對整個系統(tǒng)發(fā)育關系中的所有基因的直系同源對/旁系同源對進行輸出,默認只report那些直系同源對
-min_support_node:浮點數(shù)式矫;Min node support toconsider orthology relationships. If not set, all relationships are considered.
-spstree:物種樹的路徑乡摹;如果物種樹被提供,possvm將會使用物種樹調和算法而不是物種重疊算法
Possvm運行(在該軟件中我認為-s參數(shù)的設定對于OG大小比較關鍵):
Conda activatepossvm
激活conda環(huán)境后采转,使用test下面的數(shù)據(jù)進行測試:
$possvm? -i test/fa_synthases.newick -p 1_1