宏病毒組 | 玩轉(zhuǎn)vConTACT2

1 vConTACT2的安裝

根據(jù)官網(wǎng)的安裝說明,采用推薦的Conda-based installation方法,本文針對vContact2的0.11.3版本的安裝略做了調(diào)整梆靖,采用mamba進(jìn)行安裝误阻,另外官網(wǎng)安裝的python版本有問題(python=3)垢乙,需要具體指定為python=3.7警儒,另外還要安裝一個clusterone椿肩。

wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
# Install into $HOME/conda
mamba create -y --name vContact2 python=3.7 #將python=3修改為python=3.7
source activate vContact2
mamba install -y -c bioconda vcontact2 mcl blast diamond
mamba install -y -c bioconda clusterone #添加這一行安裝clusterone荠耽,否則報錯

上述方法在我們的新服務(wù)器安裝成功钩骇,但是舊服務(wù)器就不怎么好使。報錯顯示是biopython 的版本問題。于是倘屹,我先裝的python3.6银亲,然后把python的版本換成了3.8,再指定安裝biopython的版本為1.78唐瀑,遂安裝成功群凶。具體命令如下:

conda clean --all -y
mamba update conda
mamba create --name VC-vContact2 python=3.8 -y
conda activate VC-vContact2
mamba install -y -c conda-forge biopython=1.78
mamba install -y -c bioconda vcontact2=0.11.3
mamba install -y -c bioconda mcl blast diamond
mamba install -y -c bioconda clusterone
mamba install -y -c conda-forge numpy=1.22.4 #這個才能適配python3.8

2 vConTACT2分析步驟

4 vConTACT2結(jié)果文件

vConTACT2結(jié)果中最重要的文件是網(wǎng)絡(luò)和注釋文件,其他文件多數(shù)都是臨時文件和中間結(jié)果哄辣,一般來說沒啥意義请梢。

4.1 genome_by_genome_overview.csv

該文件包含參考基因組的所有分類信息,以及所有聚類信息(初始VC (VC_22)力穗、細(xì)化后的VC (VC_22_1))毅弧、置信度量和misc評分。
其中当窗,用戶提供的序列不包含注釋信息够坐。這意味著用戶需要找到感興趣的基因組,并檢查參考基因組是否位于同一VC中崖面。如果用戶基因組與參考基因組處于同一VC子簇中元咙,那么用戶基因組極有可能屬于同一屬。如果用戶基因組在相同的VC中巫员,但不是作為參考的相同的子簇庶香,那么這兩個基因組很可能在大致屬亞科水平上是相關(guān)的。如果在同一VC或VC亞簇中沒有參考基因組简识,那么很可能它們在屬水平上根本沒有關(guān)聯(lián)赶掖。也就是說,它們可能在更高的分類學(xué)層次上(亞科七扰、科奢赂、目)有關(guān)聯(lián)。

序號 列名 注釋
1 Genome 基因組/序列名
2-4 Order/Family/Genus 目/科/屬
5 preVC 初始病毒聚類
6 VC Status 病毒聚類狀態(tài)
7 VC 病毒聚類
8 VC Size 病毒聚類數(shù)
9 Quality 質(zhì)量值
10 Adjusted P-value 調(diào)整后的P值
11 VC Avg Distance 病毒聚類平均距離
12 Topology Confidence Score 拓?fù)鋵W(xué)置信度
13 Genus Confidence Score 屬級分類置信度
14-16 VC Orders/Families/Genra 病毒聚類目/科/屬數(shù)

注:protein clusters(PCs)颈走,viral clusters (VCs)膳灶。

4.2 C1.NTW

該文件包含高于顯著性閾值的所有基因組對的源序列、目標(biāo)序列以及邊緣權(quán)重信息立由,該閾值由這兩個基因組共享N個基因的概率確定袖瞻。該文件中的最小值必須大于最小顯著性閾值(默認(rèn)值:1)。用戶可將該文件導(dǎo)入到Gephi或Cytoscape中創(chuàng)建網(wǎng)絡(luò)圖拆吆。

5 vConTACT2修復(fù)報錯

最近聋迎,跑vConTACT2[1],對比各種宏病毒數(shù)據(jù)集枣耀。
幾天過去了霉晕,分析已經(jīng)差不多接近尾聲庭再。
然而,出現(xiàn)了報錯牺堰,如下:

ERROR:vcontact2: Error in identifying excluded genomes (i.e. those dropped for being singletons or outliers): [Errno 2] No such file or directory: '/Users/bolduc.10/Downloads/merged_df_alterntaive.csv'

1 subprocess.CalledProcessError

subprocess.CalledProcessError: Command '['diamond', 'makedb', '--threads', '28', '--in', '1.vContact2/merged.faa', '-d', '1.vContact2/merged']' died with <Signals.SIGILL: 4>.
解決方式為重裝diamond拄轻。

conda install -y diamond

2 Error in identifying excluded genomes

百度了幾下,毛都沒搜到伟葫。
最終還是Google比較好使恨搓,
瞬間找到“Asier Zaragoza Solas”大佬給出的建議[2]。

根據(jù)大佬的建議筏养,解決方法如下:
首先斧抱,用vim打開summaries.py文件進(jìn)行編輯。

vi ~/miniconda3/envs/vContact2/lib/python3.8/site-packages/vcontact2/exports/summaries.py

找到下面這行:

merged_df.to_csv('/Users/bolduc.10/Downloads/merged_df_alterntaive.csv')

將單引號中的目錄改為本機中存在的目錄渐溶。

merged_df.to_csv('~/merged_df_alterntaive.csv')

就醬;云帧!茎辐!

參考文獻(xiàn)

[1] https://bitbucket.org/MAVERICLab/vcontact2/wiki/Home
[2] https://bitbucket.org/MAVERICLab/vcontact2/issues/57/error-in-identifying-excluded-genomes
[3] Guo, J., Vik, D., Pratama, A. A., Roux, S., & Sullivan, M. (2021). Viral sequence identification SOP with 626 VirSorter2 V.3. 8–11. https://doi.org/dx.doi.org/10.17504/protocols.io.bwm5pc86

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末宪郊,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子拖陆,更是在濱河造成了極大的恐慌弛槐,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件依啰,死亡現(xiàn)場離奇詭異丐黄,居然都是意外死亡,警方通過查閱死者的電腦和手機孔飒,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來艰争,“玉大人坏瞄,你說我怎么就攤上這事∷ψ浚” “怎么了鸠匀?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長逾柿。 經(jīng)常有香客問我缀棍,道長,這世上最難降的妖魔是什么机错? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任爬范,我火速辦了婚禮,結(jié)果婚禮上弱匪,老公的妹妹穿的比我還像新娘青瀑。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布斥难。 她就那樣靜靜地躺著枝嘶,像睡著了一般。 火紅的嫁衣襯著肌膚如雪哑诊。 梳的紋絲不亂的頭發(fā)上群扶,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天,我揣著相機與錄音镀裤,去河邊找鬼竞阐。 笑死,一個胖子當(dāng)著我的面吹牛淹禾,可吹牛的內(nèi)容都是我干的馁菜。 我是一名探鬼主播,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼铃岔,長吁一口氣:“原來是場噩夢啊……” “哼汪疮!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起毁习,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤智嚷,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后纺且,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體盏道,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年载碌,在試婚紗的時候發(fā)現(xiàn)自己被綠了猜嘱。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡嫁艇,死狀恐怖朗伶,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情步咪,我是刑警寧澤论皆,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布,位于F島的核電站猾漫,受9級特大地震影響点晴,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜悯周,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一粒督、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧禽翼,春花似錦坠陈、人聲如沸萨惑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽庸蔼。三九已至,卻和暖如春贮匕,著一層夾襖步出監(jiān)牢的瞬間姐仅,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工刻盐, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留掏膏,地道東北人。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓敦锌,卻偏偏與公主長得像馒疹,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子乙墙,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內(nèi)容