<meta charset="utf-8">
TBtools 是一個(gè)集合了超多生信處理的小工具,非常方便,而且是無命令行的操作,入門門檻極低。開發(fā)者是華南農(nóng)業(yè)大學(xué)陳程杰博士做入,TBtools文章地址:https://www.biorxiv.org/content/early/2018/03/27/289660
,使用參考頁(yè)面https://www.yuque.com/cjchen/hirv8i
最近要使用本地blast來尋找組內(nèi)基因組的相似序列同衣,所以準(zhǔn)備使用tbtools來試試竟块。
1.blast使用
1.1 數(shù)據(jù)庫(kù)構(gòu)建
參考網(wǎng)頁(yè)https://zhuanlan.zhihu.com/p/418163788
首先打開軟件界面,選擇BLAST→BLAST GUI Wrapper→Blast Zone 會(huì)出現(xiàn)如下界面
然后在這個(gè)界面先構(gòu)建一個(gè)本地的數(shù)據(jù)庫(kù)耐齐,作為blast的數(shù)據(jù)庫(kù)浪秘。
可以點(diǎn)擊config按鈕來設(shè)置數(shù)據(jù)庫(kù)的存放位置前弯。
點(diǎn)擊圖中的加號(hào)就可以添加本地的數(shù)據(jù)來構(gòu)建數(shù)據(jù)庫(kù)了。
點(diǎn)擊確定之后一段時(shí)間完成數(shù)據(jù)庫(kù)構(gòu)建
如果要添加更多的數(shù)據(jù)庫(kù)操作類似秫逝,刪除數(shù)據(jù)庫(kù)的話直接選中數(shù)據(jù)庫(kù)然后選擇 “-”就行了恕出。
1.2 使用序列進(jìn)行BLAST
直接將需要BLAST的序列粘貼到input文本框中,選擇好輸出文件的格式违帆、文件名和位置點(diǎn)擊start就可以開始了(超短序列需要選擇short mode)浙巫。
查看結(jié)果
結(jié)束之后,點(diǎn)擊右下角的 Visulize 或TextView進(jìn)行查看刷后,Visulize有幾種模式查看的畴,點(diǎn)擊之后在左上角出現(xiàn)圖標(biāo)選項(xiàng),下拉選擇之后再關(guān)掉就會(huì)出現(xiàn)顯示的界面尝胆。
如選擇Aligmemt Shorer會(huì)出現(xiàn)如下的結(jié)果
選擇Dot Plot會(huì)出現(xiàn)如下結(jié)果:
選擇Pileup Graph會(huì)出現(xiàn)如下結(jié)果
而使用TextView則會(huì)顯示文本信息如下:
(Frame = -1則表示是反向序列)
這樣就能看到BLAST所有結(jié)果的信息丧裁。
2. 根據(jù)Blast結(jié)果提取對(duì)應(yīng)序列
提取對(duì)應(yīng)序列需要使用tbtools中的Fasta Extract功能。
點(diǎn)擊Sequence→Fasta tools→Fasta Extract (Recommended)進(jìn)人Fasta Extract界面
從界面上來看含衔,分為 6 大塊煎娇,其中絕大多數(shù)是可選項(xiàng)(即可以不做調(diào)整)。
- Fasta 序列文件輸入文本框贪染,用戶可以直接拖拽硬盤中的 Fasta 文件并放置到文本框中缓呛,路徑會(huì)自動(dòng)獲取杭隙;也可以點(diǎn)擊跟隨文本框的摁鈕“...”哟绊,在彈出文件選擇框中選取對(duì)應(yīng)文件即可
- Initialize 摁鈕,在設(shè)置 Fasta 序列文件后痰憎,可以看到 Start 摁鈕仍然不可點(diǎn)擊票髓。需要用戶點(diǎn)擊 Initialize 摁鈕,創(chuàng)建 Fasta 序列索引文件(如前期已有铣耘,則會(huì)軟件會(huì)自動(dòng)復(fù)用洽沟,節(jié)省計(jì)算時(shí)間)
- 輸出文件設(shè)置文本框,用戶同樣可以拖拽放置文件或者文件夾涡拘,程序會(huì)自動(dòng)獲取輸出文件夾玲躯,用戶需要補(bǔ)全一個(gè)輸出文件名;當(dāng)然也可以直接點(diǎn)擊跟隨文本框的摁鈕鳄乏,在彈出的問價(jià)選擇框中設(shè)置對(duì)應(yīng)輸出文件即可
- 待提取序列信息設(shè)置框,參考界面說明棘利,接受三種類型的提取模式:
● 基于 ID 的完整序列記錄提取橱野,如輸入 Unigene_1 ... 等完整序列 ID,每行一個(gè)善玫,即可提取完整序列記錄
● 基于 序列坐標(biāo)信息水援,進(jìn)行序列區(qū)間截取密强,如提取染色體 Chr1 上第 10000 個(gè)堿基到 20000 個(gè)堿基的一段序列,那么輸入如下蜗元。如果需要提取反向互補(bǔ)序列或渤,使起始坐標(biāo)大于終止坐標(biāo)即可。
# 注意奕扣,制表符[\t]分隔薪鹦,而非空白[Space]分隔(試了下現(xiàn)在用空格好像也可以了)
Chr1 10000 20000
# 提取反向互補(bǔ)序列,則翻轉(zhuǎn)堿基坐標(biāo)
Chr1 20000 10000
提取坐標(biāo)信息的功能惯豆,重命名區(qū)間池磁,如我們需要提取 Peak 或者 Promoter 序列信息,并指定輸出時(shí)序列名字
peak_1 Chr1 10000 10200
promoter_ATG8 Chr2 20300 22300