基于 GetOrganelle 組裝葉綠體基因組

GetOrganelle是一款由中國科學(xué)院昆明植物研究所的金建軍和郁文彬兩位老師共同開發(fā)的質(zhì)體組裝軟件盒使,主要用于從基因組測(cè)序數(shù)據(jù)中組裝完整的細(xì)胞器基因組薪寓,尤其擅長組裝植物質(zhì)體基因組侣灶。

需要調(diào)用的軟件包括SPAdes、Bowtie2并淋、BLAST+刁憋、Bandage等。更詳細(xì)的內(nèi)容見?軟件官網(wǎng)墓毒。

安裝

個(gè)人不太習(xí)慣 conda 安裝吓揪,使用了非 conda 安裝流程:

## 下載?GetOrganelle 安裝包

curl -L https://github.com/Kinggerm/GetOrganelle/archive/1.7.4.1.tar.gz | tar zx

## 下載依賴環(huán)境

curl -L https://github.com/Kinggerm/GetOrganelleDep/releases/download/v1.7.0/v1.7.0-linux.tar.gz | tar zx

依賴環(huán)境為?SPAdes, Bowtie2, BLAST。

## 嘗試安裝:

cd GetOrganelle-1.7.4.1

python? set,py install

遇見如下報(bào)錯(cuò):

The following error occurred while trying to add or remove files in the installation directory:

[Errno 13] Permission denied: '/build/Cellar/anaconda2/lib/python2.7/site-packages/test-easy-install-367240.write-test'

The installation directory you specified (via --install-dir, --prefix, or the distutils default setting) was: /build/Cellar/anaconda2/lib/python2.7/site-packages/

## 默認(rèn)目錄下無權(quán)限所计,改到自己的文件夾下:

python? set,py install? --prefix=/my/file

遇見如下報(bào)錯(cuò):

error: bad install directory or PYTHONPATH

* You can choose a different installation directory, i.e., one that is on PYTHONPATH or supports .pth files

* You can add the installation directory to the PYTHONPATH environment variable.? (It must then also be on PYTHONPATH whenever you run Python and want to use the package(s) you are installing.)

* You can set up the installation directory to support ".pth" files by using one of the approaches described here:

https://setuptools.readthedocs.io/en/latest/easy_install.html#custom-installation-locations

將安裝目錄添加到PYTHONPATH環(huán)境變量中:

export PYTHONPATH="$PYTHONPATH:/my/file/"

而后再安裝:

python? set,py install? --prefix=/my/file

順利完成柠辞。之后記得將依賴環(huán)境以及本軟件的 bin 目錄配置到 .bashrc 文件內(nèi)。

試運(yùn)行

# 下載示例文件:

## 下載參考序列庫:

get_organelle_config.py--addembplant_pt,embplant_mt

## 下載重測(cè)序數(shù)據(jù) fq 文件:

wget https://github.com/Kinggerm/GetOrganelleGallery/raw/master/Test/reads/Arabidopsis_simulated.1.fq.gz

wget https://github.com/Kinggerm/GetOrganelleGallery/raw/master/Test/reads/Arabidopsis_simulated.2.fq.gz

## 組裝葉綠體基因組

get_organelle_from_reads.py -1 Arabidopsis_simulated.1.fq.gz -2 Arabidopsis_simulated.2.fq.gz -t 1 -o Arabidopsis_simulated.plastome -F embplant_pt -R 10

參數(shù)詳解:

# -1 Arabidopsis_simulated.1.fq.gz Input file with the forward paired-end reads (*.fq/.gz/.tar.gz)

# -2 Arabidopsis_simulated.2.fq.gz Input file with the reverse paired-end reads (*.fq/.gz/.tar.gz)

# -t 1 Maximum threads to use. Default: 1

# -o Arabidopsis_simulated.plastome Output directory

# -F embplant_pt Target organelle genome type(s)

# -R 10 Maximum extension rounds

組裝失敗醉箕,有報(bào)錯(cuò):

......?

2024-06-08 19:04:25,434 - ERROR: sympy/scipy not available! Disentangling disabled!!

......

2024-06-08 17:47:03,893 - ERROR: Error with running SPAdes: == Error == system call for: "['/XX/GetOrganelle/GetOrganelleDep/linux/SPAdes/bin/spades-core', '/XX/GetOrganelle/example/Arabidopsis_simulated.plastome/seed/embplant_pt.initial.fq.spades/K45/configs/config.info']" finished abnormally, OS return value: 1

2024-06-08 17:47:03,894 - WARNING: Pre-assembling failed. The estimations for embplant_pt-hitting base-coverage and word size may be misleading.

......

2024-06-08 17:47:17,892 - WARNING: Compression after read correction will be skipped for lack of 'pigz'

2024-06-08 17:47:17,893 - INFO: spades.py -t 1? --disable-gzip-output --phred-offset 33 -1 Arabidopsis_simulated.plastome/extended_1_paired.fq -2 Arabidopsis_simulated.plastome/extended_2_paired.fq --s1 Arabidopsis_simulated.plastome/extended_1_unpaired.fq --s2 Arabidopsis_simulated.plastome/extended_2_unpaired.fq -k 21,55,85,115 -o Arabidopsis_simulated.plastome/extended_spades

2024-06-08 17:47:18,805 - ERROR: Error with running SPAdes: == Error ==? system call for: "['/XX/GetOrganelle/GetOrganelleDep/linux/SPAdes/bin/spades-hammer', '/XX/GetOrganelle/example/Arabidopsis_simulated.plastome/extended_spades/corrected/configs/config.info']" finished abnormally, OS return value: 1

2024-06-08 17:47:18,806 - ERROR: Assembling failed.

## 安裝 sympy 和 scipy?

pip install sympy scipy --prefix=/my/folder2

Requirement already satisfied: sympy in /build/Cellar/anaconda2/lib/python2.7/site-packages (1.3)

Requirement already satisfied: scipy in /build/Cellar/anaconda2/lib/python2.7/site-packages (1.2.1)

提示這兩個(gè)庫已經(jīng)安裝過了,但在運(yùn)行的時(shí)候仍提示:2024-06-08 19:04:25,434 - ERROR: sympy/scipy not available! Disentangling disabled!!

可能是前面改變了 PYTHONPATH徙垫,如果將之前的 export?PYTHONPATH 取消讥裤,則會(huì)出現(xiàn)新的報(bào)錯(cuò):

Traceback (most recent call last):

????File "/mnt/ge-jbod/zhanghongxiang/software/GetOrganelle/GetOrganelle-1.7.4.1/bin/get_organelle_from_reads.py", line 12, in <module>

? ? import GetOrganelleLib

ImportError: No module named GetOrganelleLib

解決辦法為同時(shí)添加兩個(gè) PYTHONPATH:

export PYTHONPATH="/path/to/folder1:/path/to/folder2"

## 安裝 pigz

wget https://github.com/madler/pigz/archive/refs/heads/master.zip

unzip?master.zip

cd??pigz-master

make

再運(yùn)行,還是報(bào)錯(cuò):

......

2024-06-08 18:44:42,484 - ERROR: Error with running SPAdes: == Error == system call for: "['/XX/GetOrganelle/GetOrganelleDep/linux/SPAdes/bin/spades-core', '/XX/GetOrganelle/example/Arabidopsis_simulated.plastome/seed/embplant_pt.initial.fq.spades/K45/configs/config.info']" finished abnormally, OS return value: 1

2024-06-08 18:44:42,485 - WARNING: Pre-assembling failed. The estimations for embplant_pt-hitting base-coverage and word size may be misleading.

......

2024-06-08 18:44:57,031 - ERROR: Error with running SPAdes: == Error == system call for: "['/XX/GetOrganelle/GetOrganelleDep/linux/SPAdes/bin/spades-hammer', '/XX/GetOrganelle/example/Arabidopsis_simulated.plastome/extended_spades/corrected/configs/config.info']" finished abnormally, OS return value: 1

2024-06-08 18:44:57,032 - ERROR: Assembling failed.

查了一下可能是?SPAdes 的問題姻报,Github 上有人反映說改一個(gè)命令就行:

I asked server administrator and showed him my scripts, then it run successfully by removimg "srun" out from my code.&nbsp?

詳見 Github 上的討論己英。

我嫌麻煩,將原 3.15.4 的版本替換為了 3.15.3吴旋,再次運(yùn)行不再報(bào)錯(cuò)损肛。

2024-06-08 19:05:28,351 - INFO: Slimming Arabidopsis_simulated.plastome/extended_spades/K115/assembly_graph.fastg finished!

2024-06-08 19:05:28,352 - INFO: Slimming assembly graphs finished.




以上是我學(xué)習(xí)過程整理的隨手筆記,希望能幫到大家荣瑟!如果有幫助治拿,希望不吝點(diǎn)個(gè)贊,或者關(guān)注笆焰,也是對(duì)我的一個(gè)肯定或者鼓勵(lì)劫谅。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市嚷掠,隨后出現(xiàn)的幾起案子捏检,更是在濱河造成了極大的恐慌,老刑警劉巖不皆,帶你破解...
    沈念sama閱讀 216,324評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件贯城,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡霹娄,警方通過查閱死者的電腦和手機(jī)能犯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門鲫骗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人悲雳,你說我怎么就攤上這事挎峦。” “怎么了合瓢?”我有些...
    開封第一講書人閱讀 162,328評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵坦胶,是天一觀的道長。 經(jīng)常有香客問我晴楔,道長顿苇,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,147評(píng)論 1 292
  • 正文 為了忘掉前任税弃,我火速辦了婚禮纪岁,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘则果。我一直安慰自己幔翰,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評(píng)論 6 388
  • 文/花漫 我一把揭開白布西壮。 她就那樣靜靜地躺著遗增,像睡著了一般。 火紅的嫁衣襯著肌膚如雪款青。 梳的紋絲不亂的頭發(fā)上做修,一...
    開封第一講書人閱讀 51,115評(píng)論 1 296
  • 那天,我揣著相機(jī)與錄音抡草,去河邊找鬼饰及。 笑死,一個(gè)胖子當(dāng)著我的面吹牛康震,可吹牛的內(nèi)容都是我干的燎含。 我是一名探鬼主播,決...
    沈念sama閱讀 40,025評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼腿短,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼瘫镇!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起答姥,我...
    開封第一講書人閱讀 38,867評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤铣除,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后鹦付,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體尚粘,經(jīng)...
    沈念sama閱讀 45,307評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評(píng)論 2 332
  • 正文 我和宋清朗相戀三年敲长,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了郎嫁。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片秉继。...
    茶點(diǎn)故事閱讀 39,688評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖泽铛,靈堂內(nèi)的尸體忽然破棺而出尚辑,到底是詐尸還是另有隱情,我是刑警寧澤盔腔,帶...
    沈念sama閱讀 35,409評(píng)論 5 343
  • 正文 年R本政府宣布杠茬,位于F島的核電站,受9級(jí)特大地震影響弛随,放射性物質(zhì)發(fā)生泄漏瓢喉。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評(píng)論 3 325
  • 文/蒙蒙 一舀透、第九天 我趴在偏房一處隱蔽的房頂上張望栓票。 院中可真熱鬧,春花似錦愕够、人聲如沸走贪。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽坠狡。三九已至,卻和暖如春强衡,著一層夾襖步出監(jiān)牢的瞬間擦秽,已是汗流浹背码荔。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評(píng)論 1 268
  • 我被黑心中介騙來泰國打工漩勤, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人缩搅。 一個(gè)月前我還...
    沈念sama閱讀 47,685評(píng)論 2 368
  • 正文 我出身青樓越败,卻偏偏與公主長得像,于是被迫代替她去往敵國和親硼瓣。 傳聞我的和親對(duì)象是個(gè)殘疾皇子究飞,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容