各種常用的處理命令

●在fastq-dump拆分SRA文件時遇到報錯

image.png
解決方案:

因為NCBI上的下載鏈接從http變?yōu)榱薶ttps尤蒿,所以安裝最新版sratoolkit即可解決問題

●使用fasterq-dump拆分SRA文件,速度更快

fasterq-dump --split-files SRR934398.sra -e 10 -p

##--split-files最好是--split-3袱吆,但是有些特殊情況--split-3拆分不開雙端數據就用--split-files。

●遇到報錯error while loading shared libraries: libcrypto.so.1.0.0: cannot open shared object file: No such file or directory

1隆判、先查看libcrypto.so.1.0所在目錄
image.png

發(fā)現沒有libcrypto.so.1.0.0這個文件麻蹋,因此,嘗試建立一個叫libcrypto.so.1.0.0的符號鏈接向/usr/lib64/libcrypto.so.1.0.2k

2、建立軟鏈接
ln -s /usr/lib64/libcrypto.so.1.0.2k ~/miniconda3/lib/libcrypto.so.1.0.0

●統(tǒng)計測序深度夜只,使用vcf文件

vcftools --vcf test.vcf \
         --depth -c \
         > depth_summary.txt

●提取染色體片段

       vcftools --gzvcf Duroc.vcf.gz \
                --chr NC_010484.4 \
                --from-bp 181225 \
                --to-bp 182187 \
                --out MC1R-Duroc.vcf \
                --recode \
                --recode-INFO-all 

●提取文件中的某幾列

awk '{print$1,$2}' fileame.vcf > filename.txt
##$1代表第一列

●根據位置提取vcf文件對應位點的信息

vcftools --vcf 12_28.filter.snps.indels.vcf --positions test.txt --out test --recode

●提取某一列數值滿足條件的列

awk -F'\t' '{if ($3 == 1) print $1\t$2\t$3}' t.txt > 1.txt

#以Tab鍵分割
awk 'BEGIN{IFS='\t'}{if ($5 > 0) print $1,$2,$2+1,$5}' 12.26-CHINA.freq.frq > 12.26-CHINA.maf0.frq.txt

●提取某些樣本

bcftools view -S id.txt 20211005_sheep_222_total.vcf.gz > tibetan_36.vcf 

###●其中 id.txt 為一列樣本id

●去除vcf文件中帶*的等位基因

grep -v "*" JBC-geno005-maf005.vcf > JBC-geno005-maf005.filter.vcf

●格式轉化

1 bed、bim蒜魄、fam轉vcf
plink --allow-extra-chr \
      --chr-set 26 \
      -bfile xll \
      --recode vcf-iid \
      --out xll
2 bed扔亥、bim、fam轉map谈为、ped
plink --allow-extra-chr \
      --chr-set 26 \
      -bfile filename \
      --recode \
      --out filename
3 ped旅挤、map轉bed、bim伞鲫、fam
plink --allow-extra-chr \
      --chr-set 26 \
      --file tibetan_36 \
      --make-bed \
      --out tibetan_36
4 map粘茄、ped轉為vcf
plink --allow-extra-chr \
      --chr-set 26 \
      -file xll \
      --recode vcf-iid \
      --out xll
5 vcf轉ped、map
plink --allow-extra-chr \
      --chr-set 26 \
      --vcf tibetan_36.vcf \
      --recode \
      --double-id \   
      --out tibetan_36
###double-id兩個family id 和idividual id一樣秕脓,所以加上了這個代碼
6 vcf轉bed柒瓣、bim、fam
plink --allow-extra-chr \
      --chr-set 26 \ 
      -vcf XXX.vcf \
      --make-bed \
      --double-id \
      --out XXX

●缺失率統(tǒng)計

## 按照位點統(tǒng)計
vcftools --gzvcf test.vcf.gz \
         --missing-site \
         --out test.SNP_missing 
## 按照個體統(tǒng)計
vcftools --vcf  test.vcf   \
         --missing-indv \
         --out test.SNP_missing

●過濾indel和snp

## INDEL
vcftools --remove-indels \
         --recode \
         --recode-INFO-all \
         --vcf test.vcf \
         --stdout \
         > test.snp.vcf
## SNP
vcftools --keep-only-indels  \
         --recode \
         --recode-INFO-all \
         --vcf test.vcf \
         --stdout \
         > test.indel.vcf

●去除多等位基因及indel

bcftools view -m 2 \
              -M 2 \
              --type "snps"  test.vcf.gz \
              -Ov \
              -o test.record.snps.vcf.gz

## 注意一下:-O為輸出文件的格式吠架,其中z為壓縮的vcf文件芙贫,v為正常的vcf文件,
vcftools --vcf   test.vcf \
         --remove-indels \
         --min-alleles 2 \
         --max-alleles 2 \
         --recode \
         --recode-INFO-all \
         --stdout \
         > test.miss.snp.vcf
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末傍药,一起剝皮案震驚了整個濱河市磺平,隨后出現的幾起案子,更是在濱河造成了極大的恐慌拐辽,老刑警劉巖拣挪,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異俱诸,居然都是意外死亡菠劝,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進店門乙埃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來闸英,“玉大人,你說我怎么就攤上這事介袜「危” “怎么了?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵遇伞,是天一觀的道長辙喂。 經常有香客問我,道長,這世上最難降的妖魔是什么巍耗? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任秋麸,我火速辦了婚禮,結果婚禮上炬太,老公的妹妹穿的比我還像新娘灸蟆。我一直安慰自己,他們只是感情好亲族,可當我...
    茶點故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布炒考。 她就那樣靜靜地躺著,像睡著了一般霎迫。 火紅的嫁衣襯著肌膚如雪斋枢。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天知给,我揣著相機與錄音瓤帚,去河邊找鬼。 笑死涩赢,一個胖子當著我的面吹牛戈次,可吹牛的內容都是我干的。 我是一名探鬼主播谒主,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼朝扼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了霎肯?” 一聲冷哼從身側響起擎颖,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎观游,沒想到半個月后搂捧,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡懂缕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年允跑,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片搪柑。...
    茶點故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡聋丝,死狀恐怖,靈堂內的尸體忽然破棺而出工碾,到底是詐尸還是另有隱情弱睦,我是刑警寧澤,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布渊额,位于F島的核電站况木,受9級特大地震影響垒拢,放射性物質發(fā)生泄漏。R本人自食惡果不足惜火惊,卻給世界環(huán)境...
    茶點故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一求类、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧屹耐,春花似錦尸疆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽鸵贬。三九已至俗他,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間阔逼,已是汗流浹背兆衅。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留嗜浮,地道東北人羡亩。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像危融,于是被迫代替她去往敵國和親畏铆。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,762評論 2 345

推薦閱讀更多精彩內容

  • 3010份亞洲稻群體重測序項目是由中國農業(yè)科學院作物科學研究所牽頭吉殃,聯合國際水稻研究所辞居、華大基因等16家單位共同完...
    Nuvolar閱讀 8,505評論 14 18
  • 按照前人的教程,跑了跑GWAS流程蛋勺,作為初學者瓦灶,歡迎大家提問,指教抱完。 數據來源:A new regulator o...
    1yon閱讀 3,914評論 0 10
  • #########################################################...
    bettermaan閱讀 2,974評論 1 7
  • 自己找了一些文章和視頻贼陶,先總結了一部分,后面再做補充和實操 一. 相關概念理解 (1)GWAS: 全稱“全基因組關...
    奔跑的Forrest閱讀 15,900評論 2 38
  • PLINK語法體驗 by張成龍 郵箱:yianquanwl@qq.com[mailto:yianquanwl@qq...
    超級宇航員閱讀 6,381評論 0 20