運(yùn)用seqkit對(duì)fasta去重

軟件介紹
Seqkit是一款專門處理fsata/q序列文件的軟件今布,由go語言編寫经备,功能比較完善,軟件使用也很穩(wěn)定部默。

安裝方法
方法一:下載二進(jìn)制文件(最新的穩(wěn)定/開發(fā)版本)
下載地址:https://bioinf.shenwei.me/seqkit/download/只需要載您的操作系統(tǒng)的壓縮可執(zhí)行文件侵蒙,并使用tar -zxvf *.tar.gz命令或其他工具解壓即可

方法二:通過conda安裝(最新穩(wěn)定版)
conda install -c bioconda seqkit

方法三:通過homebrew安裝(最新穩(wěn)定版)
brew install seqkit

Usage:
  seqkit rmdup [flags]

Flags:
  -n, --by-name                by full name instead of just id  #通過fasta的名字去重,相同fasta ID的序列會(huì)被去除
  -s, --by-seq                 by seq #通過fasta 的序列去重傅蹂,相同堿基組成的序列會(huì)被去除
  -D, --dup-num-file string    file to save number and list of duplicated seqs #用來存放被去除序列的信息的文件
  -d, --dup-seqs-file string   file to save duplicated seqs #用來存在被去除的序列
  -h, --help                   help for rmdup
  -i, --ignore-case            ignore case

Global Flags:
      --alphabet-guess-seq-length int   length of sequence prefix of the first FASTA record based on which seqkit guesses the sequence type (0 for whole seq) (default 10000)
      --id-ncbi                         FASTA head is NCBI-style, e.g. >gi|110645304|ref|NC_002516.2| Pseud...
      --id-regexp string                regular expression for parsing ID (default "^(\\S+)\\s?")
      --infile-list string              file of input files list (one file per line), if given, they are appended to files from cli arguments
  -w, --line-width int                  line width when outputing FASTA format (0 for no wrap) (default 60)
  -o, --out-file string                 out file ("-" for stdout, suffix .gz for gzipped out) (default "-")
      --quiet                           be quiet and do not show extra information
  -t, --seq-type string                 sequence type (dna|rna|protein|unlimit|auto) (for auto, it automatically detect by the first sequence) (default "auto")
  -j, --threads int                     number of CPUs. (default value: 1 for single-CPU PC, 2 for others. can also set with environment variable SEQKIT_THREADS) (default 2)

示例

1.按照fasta的ID去重纷闺,相同ID的序列被去除:

seqkit rmdup -n test.fasta -o test.rmdup.fasta

2.按照fasta序列去重,相同堿基組成的序列被去除:

seqkit rmdup -s test.fasta -o test.rmdup.fasta
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末份蝴,一起剝皮案震驚了整個(gè)濱河市犁功,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌婚夫,老刑警劉巖浸卦,帶你破解...
    沈念sama閱讀 217,277評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異案糙,居然都是意外死亡限嫌,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門时捌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來怒医,“玉大人,你說我怎么就攤上這事奢讨≈商荆” “怎么了?”我有些...
    開封第一講書人閱讀 163,624評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵禽笑,是天一觀的道長入录。 經(jīng)常有香客問我,道長佳镜,這世上最難降的妖魔是什么僚稿? 我笑而不...
    開封第一講書人閱讀 58,356評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮蟀伸,結(jié)果婚禮上蚀同,老公的妹妹穿的比我還像新娘。我一直安慰自己啊掏,他們只是感情好蠢络,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著迟蜜,像睡著了一般刹孔。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上娜睛,一...
    開封第一講書人閱讀 51,292評(píng)論 1 301
  • 那天髓霞,我揣著相機(jī)與錄音卦睹,去河邊找鬼。 笑死方库,一個(gè)胖子當(dāng)著我的面吹牛结序,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播纵潦,決...
    沈念sama閱讀 40,135評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼徐鹤,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了邀层?” 一聲冷哼從身側(cè)響起返敬,我...
    開封第一講書人閱讀 38,992評(píng)論 0 275
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎寥院,沒想到半個(gè)月后救赐,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,429評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡只磷,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了泌绣。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片钮追。...
    茶點(diǎn)故事閱讀 39,785評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖阿迈,靈堂內(nèi)的尸體忽然破棺而出元媚,到底是詐尸還是另有隱情,我是刑警寧澤苗沧,帶...
    沈念sama閱讀 35,492評(píng)論 5 345
  • 正文 年R本政府宣布刊棕,位于F島的核電站,受9級(jí)特大地震影響待逞,放射性物質(zhì)發(fā)生泄漏甥角。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評(píng)論 3 328
  • 文/蒙蒙 一识樱、第九天 我趴在偏房一處隱蔽的房頂上張望嗤无。 院中可真熱鬧,春花似錦怜庸、人聲如沸当犯。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽嚎卫。三九已至,卻和暖如春宏榕,著一層夾襖步出監(jiān)牢的瞬間拓诸,已是汗流浹背侵佃。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評(píng)論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留恰响,地道東北人趣钱。 一個(gè)月前我還...
    沈念sama閱讀 47,891評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像胚宦,于是被迫代替她去往敵國和親首有。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容