2?? 雙序列比對(2):BLAST詳細(xì)操作:web版和linux版

序列比對和序列特征分析總目錄

網(wǎng)址:https://blast.ncbi.nlm.nih.gov/Blast.cgi
運(yùn)行方式:本地或web


基本的BLAST工具包括:

圖1 BLAST

blastn:核酸搜核酸數(shù)據(jù)庫
blastp:蛋白質(zhì)搜蛋白質(zhì)數(shù)據(jù)庫
blastx:DNA用所有可能的閱讀框翻譯成翻譯成蛋白后搜蛋白數(shù)據(jù)庫
tblastn:查詢的蛋白序列搜索核酸數(shù)據(jù)庫中缰犁,DNA序列翻譯后的蛋白序列
tblastx:核酸序列翻譯成蛋白質(zhì)后搜索核酸數(shù)據(jù)庫中的核酸序列翻譯后的蛋白質(zhì)序列丝格。也就是查詢的蛋白和數(shù)據(jù)庫中的DNA都翻譯成蛋白進(jìn)行比對此洲。


blast基本工具

一: web blast

舉一個例子說明
圖1可以看到为朋,輸入框可以輸入accesion number,gi妈拌,或FASTA序列棺禾,也可以上傳文件。
job title給查詢的任務(wù)取個名字本慕。

參數(shù)設(shè)置

  • Database:圖2排拷,一般選擇nr,即非冗余蛋白序列數(shù)據(jù)庫锅尘,該庫包括GenBank CDS tranlations监氢,RefSSeq Proteins布蔗,PDB,Swiss-Prot浪腐,PIR和PRF全體數(shù)據(jù)庫的非冗余數(shù)據(jù)
圖2 參數(shù)設(shè)置
  • 算法參數(shù)設(shè)置
    首先每個參數(shù)后面都有說明纵揍,可以詳細(xì)查看該選擇哪個
  • Organism可以限制物種
  • Expect threshold期望閾值,默認(rèn)10
  • word size字長议街,默認(rèn)3泽谨,還可以設(shè)置為10或2,數(shù)值小搜索的結(jié)果會增加特漩,速度會變慢
  • matrix序列比對的打分矩陣吧雹,默認(rèn)LOSUM62
  • Gap costs:BLAST采取線性空間罰分方式,為開放罰分和延伸罰分涂身,默認(rèn)是開放罰分值11雄卷,延伸罰分值1


    圖3 算法參數(shù)設(shè)置

結(jié)果解讀

  • 搜索詳細(xì)情況描述。圖4访得,查詢的分子類型龙亲,比對的數(shù)據(jù)庫,都有描述悍抑。
圖4 結(jié)果1
  • 圖形結(jié)果鳄炉。查詢序列含有的保守結(jié)構(gòu)域,以及數(shù)據(jù)庫中與查詢序列匹配項(xiàng)的圖形搜骡。不同彩色條帶顏色代表得分的高低拂盯。


    圖5 結(jié)果2
  • 詳細(xì)列表信息.與查詢的序列匹配的數(shù)據(jù)庫中的序列列表,每一個序列包括score记靡,evalue谈竿,identity,accesion等摸吠。


    圖6 結(jié)果3
  • 查詢序列與數(shù)據(jù)庫中的匹配序列之間的雙序列比對情況空凸。包括score,expect寸痢,identity同一性得分呀洲,positive相似性分值,gaps空位啼止。


    圖7 結(jié)果4

總結(jié):

web版的blast方便道逗,快捷,容易操作献烦,數(shù)據(jù)庫更新快滓窍。確定是不利于操作大力量數(shù)據(jù),也不能自定義搜索的數(shù)據(jù)庫巩那,只能對NCBI提供的數(shù)據(jù)庫進(jìn)行序列相似性分析吏夯。所以

NCBI提供了本地化安裝的blast軟件包此蜈,這樣就可以構(gòu)建自己的數(shù)據(jù)庫,提高同源性分析的準(zhǔn)確性和一致性锦亦。


二: LINUX下BLAST的安裝與運(yùn)行

優(yōu)點(diǎn):速度快舶替,靈活性大令境,可自己配置庫
缺點(diǎn):序列數(shù)據(jù)庫下載量大杠园,并且更新麻煩,需要重新下載

1 安裝配置BLAST

1.1 利用conda安裝舔庶,關(guān)于conda請看之前的簡文
#啟動環(huán)境
$ source ~/miniconda3/bin/activate
$ conda install blast

比較簡單

1.2 直接下載安裝

首先在ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/下載最新版本的BLAST程序抛蚁。

wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.8.1+-x64-linux.tar.gz
Connecting to ftp.ncbi.nlm.nih.gov (ftp.ncbi.nlm.nih.gov)|130.14.250.12|:21... connected.
Logging in as anonymous ... Logged in!
==> SYST ... done.    ==> PWD ... done.
==> TYPE I ... done.  ==> CWD (1) /blast/executables/LATEST ... done.
==> SIZE ncbi-blast-2.8.1+-x64-linux.tar.gz ... 241992963
==> PASV ... done.    ==> REST 173905320 ... done.
==> RETR ncbi-blast-2.8.1+-x64-linux.tar.gz ... done.
Length: 241992963 (231M), 68087643 (65M) remaining (unauthoritative)

ncbi-blast-2.8.1+-x64-linux.tar. 100%[++++++++++++++++++++++++++++++++++++++++================>] 230.78M  2.92MB/s    in 33s

2019-01-23 13:30:52 (1.98 MB/s) - ‘ncbi-blast-2.8.1+-x64-linux.tar.gz’ saved [241992963]

接下來解壓縮

$ tar -xzvf ncbi-blast-2.8.1+-x64-linux.tar.gz
$ rm ncbi-blast-2.8.1+-x64-linux.tar.gz
$ mv ncbi-blast-2.8.1+/ blast
$ cd blast
$ cd bin
$ ls

可執(zhí)行文件顯示如下

blastdb_aliastool  blastn             deltablast             makeblastdb    rpsblast    tblastx
blastdbcheck       blastp             dustmasker             makembindex    rpstblastn  update_blastdb.pl
blastdbcmd         blastx             get_species_taxids.sh  makeprofiledb  segmasker   windowmasker
blast_formatter    convert2blastmask  legacy_blast.pl        psiblast       tblastn

2 運(yùn)行

要進(jìn)行序列比對,得有以下幾個條件

第一惕橙,有查詢序列瞧甩,并有特定格式
第二,有目標(biāo)序列庫弥鹦,蛋白庫還是DNA庫
第三肚逸,確定查詢工具,blastn,blastp,blastx,tblastx,tblastn
第四彬坏,設(shè)定合適參數(shù)開始運(yùn)行
具體用法BLAST手冊《BLAST Command Line Applications User Manual》

2.1本地建庫

第1??:NCBI下載nt和nr庫文件到本地

BLAST database

獲取blast database的最好方法是NCBI下載朦促。
通過運(yùn)行$ update_blastdb.pl --decompress nr [*]程序,可以下載預(yù)先格式化的NCBI BLAST database栓始。

#先創(chuàng)建blast_db目錄
~$ mkdir blast_db
$ cd blast_db
# 耗時很長务冕,放入后臺
$ nohup time update_blastdb.pl nt nr > log &
$ nohup time tar -zxvf *.tar.gz > log2 &

說明:nt為核酸,nr為蛋白質(zhì)
監(jiān)控庫文件是否下載完成幻赚,如何判斷禀忆? 1. 查看log文件是否有提示;2. 查看update_blastdb.pl是否還在運(yùn)行:執(zhí)行ps -aef | grep update_blastdb.pl | grep -v update_blastdb.pl 命令落恼,如過沒有結(jié)果箩退,則說明沒有運(yùn)行了。

這部分來自hoptop也可以是從ncbi上直接下載一系列nt/nr.xx.tar.gz文件佳谦,然后解壓縮即可戴涝,后續(xù)可以用update_blastdb.pl進(jìn)行數(shù)據(jù)更新。
報(bào)錯: 使用update_blastdb.pl更新和下載數(shù)據(jù)庫時候出現(xiàn)模塊未安裝的問題吠昭。解決方法喊括,首先用conda安裝對應(yīng)的模塊,然后修改update_blastdb.pl的第一行矢棚,即shebang部分郑什,以conda的perl替換,或者按照如下方法執(zhí)行蒲肋。
perl which update_blastdb.pl
下載過程中請確保網(wǎng)絡(luò)狀態(tài)良好蘑拯,否則會出現(xiàn)Downloading nt.00.tar.gz...Unable to close datastream報(bào)錯钝满。

第2??:用自己的序列建庫makeblastdb

BLAST需要進(jìn)行序列數(shù)據(jù)的索引格式化,然后才可以進(jìn)行序列的比對搜索申窘,所以先用makeblastdb進(jìn)行格式化

makeblastdb -in mydb.fasta -dbtype nucl -parse_seqids -out dbname

簡單解釋如下:
-in :表示輸入的數(shù)據(jù)文件
-dbtype:序列數(shù)據(jù)類型弯蚜,核酸nucl,蛋白質(zhì)prot

詳細(xì)用法:
$ makeblastdb -help
USAGE
  makeblastdb [-h] [-help] [-in input_file] [-input_type type]
    -dbtype molecule_type [-title database_title] [-parse_seqids]
    [-hash_index] [-mask_data mask_data_files] [-mask_id mask_algo_ids]
    [-mask_desc mask_algo_descriptions] [-gi_mask]
    [-gi_mask_name gi_based_mask_names] [-out database_name]
    [-max_file_sz number_of_bytes] [-logfile File_Name] [-taxid TaxID]
    [-taxid_map TaxIDMapFile] [-version]

DESCRIPTION
   Application to create BLAST databases, version 2.7.1+

REQUIRED ARGUMENTS
 -dbtype <String, `nucl', `prot'>
   Molecule type of target db

OPTIONAL ARGUMENTS
 -h
   Print USAGE and DESCRIPTION;  ignore all other parameters
 -help
   Print USAGE, DESCRIPTION and ARGUMENTS; ignore all other parameters
 -version
   Print version number;  ignore other arguments

 *** Input options
 -in <File_In>
   Input file/database name
   Default = `-'
 -input_type <String, `asn1_bin', `asn1_txt', `blastdb', `fasta'>
   Type of the data specified in input_file
   Default = `fasta'

 *** Configuration options
 -title <String>
   Title for BLAST database
   Default = input file name provided to -in argument

所需的基因組文件可以下載剃法,也可以是自己測序的∷檗啵現(xiàn)在我用我自己的文件mybp.fa,看如何建庫

$ makeblastdb -in mybp.fa -dbtype nucl -out mybp -parse_seqids

顯示如下,建庫完成

Building a new DB, current time: 01/24/2019 07:55:54
New DB name:   /mnt/d/yinlibioinfor/mybp
New DB title:  mybp.fa
Sequence type: Nucleotide
Keep MBits: T
Maximum file size: 1000000000B
Adding sequences from FASTA; added 2 sequences in 0.0724082 seconds.

本地目標(biāo)文件夾會產(chǎn)生以下幾個數(shù)據(jù)庫文件


mybp

2.2:運(yùn)行

最基本的BLAST命令包含query和db參數(shù)

blastn -db mydb.fa -query xx.fa -out results.out
  • query: 檢索文件
  • remote:上面已經(jīng)把nt nr下載到本地贷洲,如果不下載可以加 -remote收厨,速度會慢
    -evalue,默認(rèn)10优构,設(shè)置輸出結(jié)果的e-value诵叁。如果E小于10-5,說明兩條序列有較高同源性钦椭,統(tǒng)計(jì)學(xué)意義顯著拧额。若小于10-6則表示同源性非常高。幾乎可以百分百確定彪腔。

A:用我自己的一段序列查詢

$ blastn -db mybp -query query.fa

結(jié)果如下:

Database: mybp.fa
           2 sequences; 7,163,595 total letters



Query= query

Length=366
                                                                      Score     E
Sequences producing significant alignments:                          (Bits)  Value

Chromosome2  circular                                                 676     0.0


>Chromosome2 circular
Length=3363129

 Score = 676 bits (366),  Expect = 0.0
 Identities = 366/366 (100%), Gaps = 0/366 (0%)
 Strand=Plus/Plus

Query  1        ATGATCAAGGACGTTCTACGACTTAAATTCGACGGCAGCCTTTCGCACGATCGGATCGCC  60
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1167368  ATGATCAAGGACGTTCTACGACTTAAATTCGACGGCAGCCTTTCGCACGATCGGATCGCC  1167427

Query  61       ACGTCGCTGGGCATTTCCAAAAGCGTGGTCACGAAGCACGTCGGACCGGCGGGCGCCGCC  120
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1167428  ACGTCGCTGGGCATTTCCAAAAGCGTGGTCACGAAGCACGTCGGACCGGCGGGCGCCGCC  1167487

Query  121      GGGCTGGACCGGGCAAGCACCTGCGAGATGGACGAGGGCGAGCGCAAGCGGCGGCTACTC  180
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1167488  GGGCTGGACCGGGCAAGCACCTGCGAGATGGACGAGGGCGAGCGCAAGCGGCGGCTACTC  1167547

Query  181      GGCAAGCCCATGAGACCAGCGACCTACGTCCAGCCCGATTACGGGCGCATCCATCAGGAA  240
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1167548  GGCAAGCCCATGAGACCAGCGACCTACGTCCAGCCCGATTACGGGCGCATCCATCAGGAA  1167607

Query  241      CTGCGCCGCAAAGGCGTGACGTTGACGCTGCTGTGGGAGGAGTACCAAGTCGAGTTCGCC  300
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1167608  CTGCGCCGCAAAGGCGTGACGTTGACGCTGCTGTGGGAGGAGTACCAAGTCGAGTTCGCC  1167667

Query  301      GGCCGGCAAACCTACCGCTCTACGCGCAATTCTGCGAGCACTACAAGGCGTTCACAAAGC  360
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1167668  GGCCGGCAAACCTACCGCTCTACGCGCAATTCTGCGAGCACTACAAGGCGTTCACAAAGC  1167727

Query  361      GTCTGA  366
                ||||||
Sbjct  1167728  GTCTGA  1167733

query序列本身就是來自上述基因組侥锦,所以完全匹配。

B:使用遠(yuǎn)程服務(wù)器在線比對,但是速度真的是很慢

$ blastn -db nr -remote -query query.fa

小部分結(jié)果如下

Database: Nucleotide collection (nt)
           49,985,097 sequences; 191,944,857,236 total letters



Query= query

Length=366

RID: 4J1C2RW4015
                                                                      Score     E
Sequences producing significant alignments:                          (Bits)  Value

CP033704.1  Burkholderia pseudomallei strain FDAARGOS_593 chromos...  676     0.0
CP033701.1  Burkholderia pseudomallei strain FDAARGOS_594 chromos...  676     0.0
CP025307.1  Burkholderia pseudomallei strain D286 chromosome 2, c...  676     0.0
CP025305.1  Burkholderia pseudomallei strain R15 chromosome R15.2...  676     0.0
CP025303.1  Burkholderia pseudomallei strain PMC2000 chromosome P...  676     0.0
CP025301.1  Burkholderia pseudomallei strain H10 chromosome H10.2     676     0.0
CP019043.1  Burkholderia pseudomallei strain 14M0960418 chromosom...  676     0.0
CP012577.1  Burkholderia pseudomallei strain 982 chromosome 2, co...  676     0.0
CP012093.1  Burkholderia pseudomallei strain 350105 chromosome 2 ...  676     0.0
CP009297.1  Burkholderia pseudomallei 406e chromosome 2, complete...  676     0.0
CP004380.1  Burkholderia pseudomallei 1026b chromosome 2, complet...  676     0.0
CP010974.1  Burkholderia pseudomallei strain vgh07 chromosome 2, ...  676     0.0
CP009127.1  Burkholderia pseudomallei strain BSR chromosome 2, co...  676     0.0
CP008893.1  Burkholderia pseudomallei HBPUB10303a chromosome 2, c...  676     0.0
CP008912.1  Burkholderia pseudomallei HBPUB10134a chromosome 2, c...  676     0.0
CP008891.1  Burkholderia pseudomallei MSHR5858 chromosome 2, comp...  676     0.0
CP008835.1  Burkholderia pseudomallei strain BGR chromosome 2, co...  676     0.0
CP008782.1  Burkholderia pseudomallei strain Mahidol-1106a chromo...  676     0.0
CP008759.1  Burkholderia pseudomallei strain 1106a chromosome 2, ...  676     0.0
CP008754.1  Burkholderia pseudomallei strain 9 chromosome 2, comp...  676     0.0
CP004002.1  Burkholderia pseudomallei NCTC 13178 chromosome 2, co...  676     0.0
CP003782.1  Burkholderia pseudomallei BPC006 chromosome II, compl...  676     0.0
CP002834.1  Burkholderia pseudomallei 1026b chromosome 2, complet...  676     0.0
CP000573.1  Burkholderia pseudomallei 1106a chromosome II, comple...  676     0.0
CP009163.1  Burkholderia pseudomallei K42 chromosome 2, complete ...  665     0.0
CP016912.1  Burkholderia pseudomallei strain Burk178-Type2 chromo...  660     0.0
CP016910.1  Burkholderia pseudomallei strain Burk178-Type1 chromo...  660     0.0
CP009160.1  Burkholderia pseudomallei TSV 48 chromosome 2, comple...  660     0.0
CP009152.1  Burkholderia pseudomallei MSHR3965 chromosome 2, comp...  660     0.0
CP008910.1  Burkholderia pseudomallei MSHR5848 chromosome 2, comp...  660     0.0
CP008783.1  Burkholderia pseudomallei MSHR5855 chromosome 2, comp...  660     0.0
CP008778.1  Burkholderia pseudomallei 576 chromosome 2, complete ...  660     0.0
CP009550.1  Burkholderia pseudomallei PB08298010 chromosome II, c...  654     0.0
CP025265.1  Burkholderia pseudomallei strain MSHR1435 chromosome ...  649     0.0
CP018412.1  Burkholderia pseudomallei strain 3000015486 chromosom...  649     0.0
CP018411.1  Burkholderia pseudomallei strain 3000015237 chromosom...  649     0.0
CP018409.1  Burkholderia pseudomallei strain 2013833057 chromosom...  649     0.0
CP018407.1  Burkholderia pseudomallei strain 2013833055 chromosom...  649     0.0
CP018398.1  Burkholderia pseudomallei strain 2013746777 chromosom...  649     0.0
CP018397.1  Burkholderia pseudomallei strain 2013746776 chromosom...  649     0.0
CP018394.1  Burkholderia pseudomallei strain 2011756296 chromosom...  649     0.0
CP018392.1  Burkholderia pseudomallei strain 2011756295 chromosom...  649     0.0
CP018388.1  Burkholderia pseudomallei strain 2010007509 chromosom...  649     0.0
CP018386.1  Burkholderia pseudomallei strain 2008724860 chromosom...  649     0.0
CP018419.1  Burkholderia pseudomallei strain 2002734728 chromosom...  649     0.0
CP018371.1  Burkholderia pseudomallei strain 2002721171 chromosom...  649     0.0
CP018370.1  Burkholderia pseudomallei strain 2002721123 chromosom...  649     0.0
CP018367.1  Burkholderia pseudomallei strain 2002721100 chromosome 2  649     0.0
CP017053.1  Burkholderia pseudomallei strain MSHR3763 chromosome ...  649     0.0
CP017051.1  Burkholderia pseudomallei strain MSHR4083 chromosome ...  649     0.0
CP009484.1  Burkholderia pseudomallei MSHR491 chromosome II, comp...  649     0.0
CP009156.1  Burkholderia pseudomallei strain TSV202 chromosome 2,...  649     0.0
CP009234.1  Burkholderia pseudomallei MSHR62 chromosome 2, comple...  649     0.0
CP009269.1  Burkholderia pseudomallei MSHR2243 chromosome 2 sequence  649     0.0
CP009210.1  Burkholderia pseudomallei strain BDP chromosome 2, co...  649     0.0
CP008763.1  Burkholderia pseudomallei strain MSHR346 chromosome 2...  649     0.0
CP008779.1  Burkholderia pseudomallei strain MSHR1655 chromosome ...  649     0.0
CP004369.1  Burkholderia pseudomallei MSHR520 chromosome 2, compl...  649     0.0
CP004043.1  Burkholderia pseudomallei MSHR146 chromosome 2, compl...  649     0.0
CP004024.1  Burkholderia pseudomallei MSHR511 chromosome 2, compl...  649     0.0
CP004004.1  Burkholderia pseudomallei NAU20B-16 chromosome 2, com...  649     0.0
CP006469.1  Burkholderia pseudomallei MSHR305 chromosome 2, compl...  649     0.0
CP009898.1  Burkholderia pseudomallei Pasteur 52237 chromosome 2,...  647     0.0
CP009586.1  Burkholderia pseudomallei strain PHLS 112 chromosome ...  647     0.0
CP008917.1  Burkholderia pseudomallei strain BGK chromosome 2         647     0.0
CP000125.1  Burkholderia pseudomallei 1710b chromosome II, comple...  647     0.0
CP009477.1  Burkholderia pseudomallei MSHR2543 chromosome II, com...  643     1e-180
CP022216.1  Burkholderia thailandensis strain FDAARGOS_242 chromo...  525     4e-145
CP022215.1  Burkholderia thailandensis strain FDAARGOS_241 chromo...  525     4e-145
CP020389.1  Burkholderia thailandensis strain FDAARGOS_237 chromo...  525     4e-145
CP013408.1  Burkholderia thailandensis strain MSMB59 chromosome 2...  525     4e-145
CP009602.1  Burkholderia thailandensis 2002721643 chromosome II, ...  525     4e-145
CP004382.1  Burkholderia thailandensis E254 chromosome 2, complet...  525     4e-145
CP004386.1  Burkholderia thailandensis MSMB59 chromosome 2, compl...  525     4e-145
CP008785.1  Burkholderia thailandensis E264 chromosome 1, complet...  525     4e-145
CP004384.1  Burkholderia thailandensis USAMRU Malaysia #20 chromo...  525     4e-145
CP004118.1  Burkholderia thailandensis E444 chromosome 2, complet...  525     4e-145
CP004098.1  Burkholderia thailandensis 2002721723 chromosome 2, c...  525     4e-145
CP000085.1  Burkholderia thailandensis E264 chromosome II, comple...  525     4e-145
CP013413.1  Burkholderia thailandensis strain 2002721643 chromoso...  499     2e-137
CP010018.1  Burkholderia thailandensis 34 chromosome 2, complete ...  499     2e-137


>CP033704.1 Burkholderia pseudomallei strain FDAARGOS_593 chromosome 2, complete
sequence
Length=3157202

 Score = 676 bits (366),  Expect = 0.0
 Identities = 366/366 (100%), Gaps = 0/366 (0%)
 Strand=Plus/Plus

Query  1        ATGATCAAGGACGTTCTACGACTTAAATTCGACGGCAGCCTTTCGCACGATCGGATCGCC  60
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2603781  ATGATCAAGGACGTTCTACGACTTAAATTCGACGGCAGCCTTTCGCACGATCGGATCGCC  2603840

Query  61       ACGTCGCTGGGCATTTCCAAAAGCGTGGTCACGAAGCACGTCGGACCGGCGGGCGCCGCC  120
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2603841  ACGTCGCTGGGCATTTCCAAAAGCGTGGTCACGAAGCACGTCGGACCGGCGGGCGCCGCC  2603900

Query  121      GGGCTGGACCGGGCAAGCACCTGCGAGATGGACGAGGGCGAGCGCAAGCGGCGGCTACTC  180
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2603901  GGGCTGGACCGGGCAAGCACCTGCGAGATGGACGAGGGCGAGCGCAAGCGGCGGCTACTC  2603960

Query  181      GGCAAGCCCATGAGACCAGCGACCTACGTCCAGCCCGATTACGGGCGCATCCATCAGGAA  240
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2603961  GGCAAGCCCATGAGACCAGCGACCTACGTCCAGCCCGATTACGGGCGCATCCATCAGGAA  2604020

Query  241      CTGCGCCGCAAAGGCGTGACGTTGACGCTGCTGTGGGAGGAGTACCAAGTCGAGTTCGCC  300
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2604021  CTGCGCCGCAAAGGCGTGACGTTGACGCTGCTGTGGGAGGAGTACCAAGTCGAGTTCGCC  2604080

Query  301      GGCCGGCAAACCTACCGCTCTACGCGCAATTCTGCGAGCACTACAAGGCGTTCACAAAGC  360
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2604081  GGCCGGCAAACCTACCGCTCTACGCGCAATTCTGCGAGCACTACAAGGCGTTCACAAAGC  2604140

Query  361      GTCTGA  366
                ||||||
Sbjct  2604141  GTCTGA  2604146

outform格式

 -outfmt <String>
   alignment view options:
     0 = Pairwise,
     1 = Query-anchored showing identities,
     2 = Query-anchored no identities,
     3 = Flat query-anchored showing identities,
     4 = Flat query-anchored no identities,
     5 = BLAST XML,
     6 = Tabular,
     7 = Tabular with comment lines,
     8 = Seqalign (Text ASN.1),
     9 = Seqalign (Binary ASN.1),
    10 = Comma-separated values,
    11 = BLAST archive (ASN.1),
    12 = Seqalign (JSON),
    13 = Multiple-file BLAST JSON,
    14 = Multiple-file BLAST XML2,
    15 = Single-file BLAST JSON,
    16 = Single-file BLAST XML2,
    17 = Sequence Alignment/Map (SAM),
    18 = Organism Report

像上面那個如果要輸出文件
可以

$ blastn -db mybp -query query.fa -outfmt 7 -out query.txt
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子赶熟,更是在濱河造成了極大的恐慌,老刑警劉巖竹宋,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件莫矗,死亡現(xiàn)場離奇詭異狡相,居然都是意外死亡彬伦,警方通過查閱死者的電腦和手機(jī)曹宴,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門废离,熙熙樓的掌柜王于貴愁眉苦臉地迎上來柿扣,“玉大人娩践,你說我怎么就攤上這事材泄〉┦拢” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵集晚,是天一觀的道長亏钩。 經(jīng)常有香客問我,道長昌屉,這世上最難降的妖魔是什么间驮? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任匙奴,我火速辦了婚禮妄荔,結(jié)果婚禮上泼菌,老公的妹妹穿的比我還像新娘。我一直安慰自己啦租,他們只是感情好哗伯,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著篷角,像睡著了一般焊刹。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上内地,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天伴澄,我揣著相機(jī)與錄音,去河邊找鬼阱缓。 笑死,一個胖子當(dāng)著我的面吹牛举农,可吹牛的內(nèi)容都是我干的荆针。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼颁糟,長吁一口氣:“原來是場噩夢啊……” “哼航背!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起棱貌,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤玖媚,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后婚脱,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體今魔,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年障贸,在試婚紗的時候發(fā)現(xiàn)自己被綠了错森。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡篮洁,死狀恐怖涩维,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情袁波,我是刑警寧澤瓦阐,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布蜗侈,位于F島的核電站,受9級特大地震影響睡蟋,放射性物質(zhì)發(fā)生泄漏宛篇。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一薄湿、第九天 我趴在偏房一處隱蔽的房頂上張望叫倍。 院中可真熱鬧,春花似錦豺瘤、人聲如沸吆倦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蚕泽。三九已至,卻和暖如春桥嗤,著一層夾襖步出監(jiān)牢的瞬間须妻,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工泛领, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留荒吏,地道東北人。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓渊鞋,卻偏偏與公主長得像绰更,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子锡宋,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容