運(yùn)用seqkit對(duì)fasta去重

軟件介紹
Seqkit是一款專門處理fsata/q序列文件的軟件今布，由go語言編寫经备，功能比較完善，軟件使用也很穩(wěn)定部默。

安裝方法
方法一：下載二進(jìn)制文件（最新的穩(wěn)定/開發(fā)版本）
下載地址：https://bioinf.shenwei.me/seqkit/download/只需要載您的操作系統(tǒng)的壓縮可執(zhí)行文件侵蒙，并使用tar -zxvf *.tar.gz命令或其他工具解壓即可

方法二：通過conda安裝（最新穩(wěn)定版）
conda install -c bioconda seqkit

方法三：通過homebrew安裝（最新穩(wěn)定版）
brew install seqkit

Usage:
  seqkit rmdup [flags]

Flags:
  -n, --by-name                by full name instead of just id  #通過fasta的名字去重，相同fasta ID的序列會(huì)被去除
  -s, --by-seq                 by seq #通過fasta 的序列去重傅蹂，相同堿基組成的序列會(huì)被去除
  -D, --dup-num-file string    file to save number and list of duplicated seqs #用來存放被去除序列的信息的文件
  -d, --dup-seqs-file string   file to save duplicated seqs #用來存在被去除的序列
  -h, --help                   help for rmdup
  -i, --ignore-case            ignore case

Global Flags:
      --alphabet-guess-seq-length int   length of sequence prefix of the first FASTA record based on which seqkit guesses the sequence type (0 for whole seq) (default 10000)
      --id-ncbi                         FASTA head is NCBI-style, e.g. >gi|110645304|ref|NC_002516.2| Pseud...
      --id-regexp string                regular expression for parsing ID (default "^(\\S+)\\s?")
      --infile-list string              file of input files list (one file per line), if given, they are appended to files from cli arguments
  -w, --line-width int                  line width when outputing FASTA format (0 for no wrap) (default 60)
  -o, --out-file string                 out file ("-" for stdout, suffix .gz for gzipped out) (default "-")
      --quiet                           be quiet and do not show extra information
  -t, --seq-type string                 sequence type (dna|rna|protein|unlimit|auto) (for auto, it automatically detect by the first sequence) (default "auto")
  -j, --threads int                     number of CPUs. (default value: 1 for single-CPU PC, 2 for others. can also set with environment variable SEQKIT_THREADS) (default 2)

示例

1.按照fasta的ID去重纷闺，相同ID的序列被去除：

seqkit rmdup -n test.fasta -o test.rmdup.fasta

2.按照fasta序列去重，相同堿基組成的序列被去除：

seqkit rmdup -s test.fasta -o test.rmdup.fasta

最后編輯于：2022.07.21 11:17:10

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末份蝴，一起剝皮案震驚了整個(gè)濱河市犁功，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌婚夫，老刑警劉巖浸卦，帶你破解...
沈念sama閱讀 217,277評(píng)論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異案糙，居然都是意外死亡限嫌，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,689評(píng)論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門时捌，熙熙樓的掌柜王于貴愁眉苦臉地迎上來怒医，“玉大人，你說我怎么就攤上這事奢讨≈商荆” “怎么了？”我有些...
開封第一講書人閱讀 163,624評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵禽笑，是天一觀的道長入录。經(jīng)常有香客問我，道長佳镜，這世上最難降的妖魔是什么僚稿？我笑而不...
開封第一講書人閱讀 58,356評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮蟀伸，結(jié)果婚禮上蚀同，老公的妹妹穿的比我還像新娘。我一直安慰自己啊掏，他們只是感情好蠢络，可當(dāng)我...
茶點(diǎn)故事閱讀 67,402評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著迟蜜，像睡著了一般刹孔。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上娜睛，一...
開封第一講書人閱讀 51,292評(píng)論 1贊 301
城市分裂傳說
那天髓霞，我揣著相機(jī)與錄音卦睹，去河邊找鬼。笑死方库，一個(gè)胖子當(dāng)著我的面吹牛结序，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播纵潦，決...
沈念sama閱讀 40,135評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼徐鹤，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了邀层？” 一聲冷哼從身側(cè)響起返敬，我...
開封第一講書人閱讀 38,992評(píng)論 0贊 275
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎寥院，沒想到半個(gè)月后救赐，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,429評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡只磷，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,636評(píng)論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了泌绣。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片钮追。...
茶點(diǎn)故事閱讀 39,785評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖阿迈，靈堂內(nèi)的尸體忽然破棺而出元媚，到底是詐尸還是另有隱情，我是刑警寧澤苗沧，帶...
沈念sama閱讀 35,492評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布刊棕，位于F島的核電站，受9級(jí)特大地震影響待逞，放射性物質(zhì)發(fā)生泄漏甥角。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,092評(píng)論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一识樱、第九天我趴在偏房一處隱蔽的房頂上張望嗤无。院中可真熱鬧，春花似錦怜庸、人聲如沸当犯。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,723評(píng)論 0贊 22
一樁弒父案割疾，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽嚎卫。三九已至，卻和暖如春宏榕，著一層夾襖步出監(jiān)牢的瞬間拓诸，已是汗流浹背侵佃。一陣腳步聲響...
開封第一講書人閱讀 32,858評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留恰响，地道東北人趣钱。一個(gè)月前我還...
沈念sama閱讀 47,891評(píng)論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像胚宦，于是被迫代替她去往敵國和親首有。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,713評(píng)論 2贊 354

運(yùn)用seqkit對(duì)fasta去重

示例

推薦閱讀更多精彩內(nèi)容