基因組的重頭組裝

1. de novo assembly

De Bruijn 圖是目前二代測序序列最常用的拼接算法,該算法將已經(jīng)非常短的reads再分割成更多個kmer短序列(k 小于reads 序列的長度),相鄰的kmers序列通過(k-1)個堿基連接到一起(即每次只移動一個位置),進而降低算法計算重疊區(qū)域的復(fù)雜度,降低內(nèi)存消耗。
常用的短序列拼接軟件有:SPAdes柳譬、Velvet划乖、SOAPdenovo刘绣、Abyss瓦戚、MasuRCA

SPAdes的安裝

python環(huán)境的安裝,推薦安裝Anoconda,可以根據(jù)需要蕾羊,配置切換不同的python環(huán)境。

wget https://repo.anaconda.com/archive/Anaconda3-5.3.1-Linux-x86_64.sh 
bash Anaconda3-5.3.1-Linux-x86_64.sh 

創(chuàng)建python2的環(huán)境

conda create --name python27 python=2.7 -y

創(chuàng)建python3的環(huán)境

conda create --name python34 python=3.4 -y

激活python3 or python2

conda activate python=3.4/2.7
激活python環(huán)境.png

安裝SPAdes軟件

wget http://cab.spbu.ru/files/release3.12.0/SPAdes-3.12.0-Linux.tar.gz
mkdir ~/BioSofts/spades
tar -zvxf ~/SPAdes-3.12.0-Linux.tar.gz -C ~/BioSofts/spades/
~/BioSofts/spades/SPAdes-3.12.0-Linux/bin/spades.py -h
echo 'export PATH=~/BioSofts/spades/SPAdes-3.12.0-Linux/bin:$PATH'>> ~/.bashrc
source ~/.bashrc
spades.py -h
SPAdes

拼接基因組數(shù)據(jù)的情況

– 僅有一個 library 數(shù)據(jù) (SE帽驯、PE龟再、ME)
– 有多個 paired-end library 數(shù)據(jù)
– 有多個 mate-paired library 數(shù)據(jù)
– 有PACBIO 數(shù)據(jù)
– 有已拼接的Contig數(shù)據(jù)

僅有一個 library 數(shù)據(jù) (SE、PE尼变、ME)

--12 file_name:12 表示后面接的文件是交叉融合的 paired 數(shù)據(jù)利凑。
-1 file_name:1 表示 forward 數(shù)據(jù)
-2 file_name:2 表示 reverse數(shù)據(jù)
-s file_name:s 表示 single 數(shù)據(jù), 也用于輸入 PacBio CCS reads

有多個 paired-end library 數(shù)據(jù)的情況

--pe{int}-12 編號為 int 的 library 的交叉融合后的paired 數(shù)據(jù)。int 取值只能是 1,2,3,4,5 嫌术,下同哀澈。
--pe{int}-1 編號為 int 的 library 的 forward 數(shù)據(jù)
--pe{int}-2 編號為 int 的 library 的 reverse 數(shù)據(jù)
--pe{int}-s 編號為 int 的 PE 的 unpaired數(shù)據(jù)
--pe{int}-{fr|rf|ff} 編號為 int 的 PE數(shù)據(jù)的方向,默認(rèn)為 --pe{int}-fr

有多個 mate-paired library 數(shù)據(jù)

--mp{int}-12 編號為 int 的 library 的交叉融合后的paired 數(shù)據(jù)
--mp{int}-1 編號為 int 的 library 的 forward 數(shù)據(jù)
--mp{int}-2 編號為 int 的 library 的 reverse 數(shù)據(jù)
--mp{int}-{fr|rf|ff} 編號為 int 的 library 的數(shù)據(jù)的方向,默認(rèn)為 --mp{int}-rf

有PacBio 數(shù)據(jù)

選用--pacbio 參數(shù)

有已拼接contig的情況

--trusted-contigs:– 輸入可信度高的 contigs,用于 graph construction,
gap closure 和 repeat resolution
--untrusted-contigs:– 輸入可信度較低的 contigs, 用于gap closure 和
repeat resolution

運行測試代碼

spades.py --careful --pe1-1 ~/Seqs/test_7942raw_1.fq.gz --pe1-2 ~/Seqs/test_7942raw_2.fq.gz -o ./SPAdesout_7942_new
2018-11-26 20-24-58屏幕截圖.png

2.序列拼接評價軟件QUAST

安裝quast

tar -zvxf quast-5.0.0.tar.gz -C ~/BioSofts/
echo 'export PATH=$PATH:~/BioSofts/quast-5.0.0/'>>~/.bashrc
source ~/.bashrc

使用quast

quast.py ~/Seqs/SPAdesout_7942_new/contigs.fasta -o ~/Seqs/SPAdesout_7942/quast_out

quast報告

2018-11-26 22-11-04屏幕截圖.png

report.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市度气,隨后出現(xiàn)的幾起案子割按,更是在濱河造成了極大的恐慌,老刑警劉巖磷籍,帶你破解...
    沈念sama閱讀 212,718評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件适荣,死亡現(xiàn)場離奇詭異现柠,居然都是意外死亡,警方通過查閱死者的電腦和手機弛矛,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評論 3 385
  • 文/潘曉璐 我一進店門够吩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人丈氓,你說我怎么就攤上這事废恋。” “怎么了扒寄?”我有些...
    開封第一講書人閱讀 158,207評論 0 348
  • 文/不壞的土叔 我叫張陵鱼鼓,是天一觀的道長。 經(jīng)常有香客問我该编,道長迄本,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,755評論 1 284
  • 正文 為了忘掉前任课竣,我火速辦了婚禮嘉赎,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘于樟。我一直安慰自己公条,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,862評論 6 386
  • 文/花漫 我一把揭開白布迂曲。 她就那樣靜靜地躺著靶橱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪路捧。 梳的紋絲不亂的頭發(fā)上关霸,一...
    開封第一講書人閱讀 50,050評論 1 291
  • 那天,我揣著相機與錄音杰扫,去河邊找鬼队寇。 笑死,一個胖子當(dāng)著我的面吹牛章姓,可吹牛的內(nèi)容都是我干的佳遣。 我是一名探鬼主播,決...
    沈念sama閱讀 39,136評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼凡伊,長吁一口氣:“原來是場噩夢啊……” “哼零渐!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起窗声,我...
    開封第一講書人閱讀 37,882評論 0 268
  • 序言:老撾萬榮一對情侶失蹤相恃,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拦耐,經(jīng)...
    沈念sama閱讀 44,330評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡耕腾,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,651評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了杀糯。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扫俺。...
    茶點故事閱讀 38,789評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖固翰,靈堂內(nèi)的尸體忽然破棺而出狼纬,到底是詐尸還是另有隱情,我是刑警寧澤骂际,帶...
    沈念sama閱讀 34,477評論 4 333
  • 正文 年R本政府宣布疗琉,位于F島的核電站,受9級特大地震影響歉铝,放射性物質(zhì)發(fā)生泄漏盈简。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,135評論 3 317
  • 文/蒙蒙 一太示、第九天 我趴在偏房一處隱蔽的房頂上張望柠贤。 院中可真熱鬧,春花似錦类缤、人聲如沸臼勉。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,864評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽宴霸。三九已至,卻和暖如春岸裙,著一層夾襖步出監(jiān)牢的瞬間猖败,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,099評論 1 267
  • 我被黑心中介騙來泰國打工降允, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人艺糜。 一個月前我還...
    沈念sama閱讀 46,598評論 2 362
  • 正文 我出身青樓剧董,卻偏偏與公主長得像,于是被迫代替她去往敵國和親破停。 傳聞我的和親對象是個殘疾皇子翅楼,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,697評論 2 351

推薦閱讀更多精彩內(nèi)容