plink常用的命令總結(jié)

1. 常用的各種格式之間的轉(zhuǎn)換

在獲得vcf文件之后,經(jīng)過過濾和提取SNP的變異之后,獲得snp.vcf文件(從fq到vcf這些可以看GTAK4的教程)箕憾。

vcf 轉(zhuǎn)為二進(jìn)制bedfile

plink --vcf test.vcf --make-bed --out test --allow-extra-chr

把vcf轉(zhuǎn)為map和ped格式

plink --vcf test.vcf --recode --out test --allow-extra-chr

map和ped文件轉(zhuǎn)為vcf格式

plink --file test --recode vcf --out test

把二進(jìn)制bedfile 轉(zhuǎn)為map和ped格式

plink --bfile test --recode --out test

#二進(jìn)制bed轉(zhuǎn)為vcf文件

plink --bfile b --recode vcf --out e

把測試的vcf轉(zhuǎn)為0,1,2編碼格式

plink --vcf Test.vcf --recode A --out TAGSNP --allow-extra-chr

ped文件中袍辞,SNP轉(zhuǎn)化為012的標(biāo)準(zhǔn)是浆兰,主等位基因為0,雜合為1盖桥,次等位基因為2,這里還區(qū)分了基因的顯隱性灾螃。

plink --bfile test --recode AD --out output_coded --allow-extra-chr
輸出文件是output_coded.raw

2. 常用的各種參數(shù)過濾

--file參數(shù)后就是plink的map和ped格式的文件名的前綴

刪除樣本材料缺失超過10%的基因型

plink --file a --geno 0.1 --recode --out re

刪除基因型缺失超過10%的樣本材料

plink --file a --mind 0.1 --recode --out re

次要等位基因頻率MAF過濾,過濾MAF<0.05的基因型,(一般設(shè)置為0.01或0.05)

plink --file a --maf 0.05 --recode --out re
這里是刪除MAF低于0.05的SNP位點揩徊。即大部分位置相同的基因型,這些位點貢獻(xiàn)的信息很少嵌赠,所以就刪除塑荒,以減小計算量。
注意:過濾的順序是先做SNP過濾--geno姜挺,再做材料過濾--mind,不要同時過濾或者顛倒過濾的順序

哈德溫伯格平衡過濾

plink --bfile test -hwe 1e-5 --recode -out test2 --allow-extra-chr 過濾哈德溫伯格p值齿税,保留大于1e-5的變異
plink --bfile test --hardy 可以輸出plink.hwe文件,可以查看具體的哈德溫伯格p值炊豪。

3.文件提取

樣本提取,提取指定樣本的基因型

plink --file test --keep id_sample.txt --recode --out re
test.ped的格式如下:

test.ped

id_sample.txt的格式和內(nèi)容如下:
第一列:FID凌箕,家系ID
第二列:IID,個體ID

B001 B001
B002 B002
B003 B003

B004 B004
B005 B005
B006 B006
B007 B007
B008 B008
B009 B009

提取指定的SNP

plink --file a --extract id_snp.txt --recode --out re --allow-extra-chr
--extract词渤, 提取SNP ID
--exclude牵舱,刪除SNP ID
plink --file test --extract id_snp.txt --recode --out res --allow-extra-chr
id_snp.txt是一列SNP ID序列編號。

我編寫的python3腳本

vcf的ID列字符串.替換為Chr_Pos這種格式缺虐,

vcfaddID.py input.vcf out.vcf
vcfaddID.py 下載

替換vcf文件的染色體編號

replaceVcfChr.py Input.vcf old2newidfile Output.vcf
replaceVcfChr.py 下載
old2newidfile是兩列chr的id,第1列是原始id,第2列是新的id,中間是tab分割芜壁。
腳本會把第1列的id替換為第2列的id。

注意事項:

1. plink1.9 會自動修改你的vcf的主次等位基因高氮。

所以如果你后續(xù)操作需要區(qū)分REF和ALT列慧妄,一定要注意這一點〖羯郑可以使用--keep-allele-order來保持原有的主等位基因塞淹,但是如果某一次忘記了,后續(xù)會很麻煩罪裹。需要重新調(diào)整主等位基因饱普。

plink --vcf ${abbr}.filter.vcf --recode A --out ${abbr}.filter --allow-extra-chr --keep-allele-order 

2. plink1.9會自動修改你的vcf的頭部的染色體的長度

比如你vcf原始的頭部中

##contig=<ID=Chr03,length=105315579>

使用plink對vcf進(jìn)行過濾操作之后,輸出的內(nèi)容的頭部可能會變成

##contig=<ID=Chr03,length=105310001>
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末坊谁,一起剝皮案震驚了整個濱河市费彼,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌口芍,老刑警劉巖箍铲,帶你破解...
    沈念sama閱讀 216,470評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異鬓椭,居然都是意外死亡颠猴,警方通過查閱死者的電腦和手機关划,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來翘瓮,“玉大人贮折,你說我怎么就攤上這事∽手眩” “怎么了调榄?”我有些...
    開封第一講書人閱讀 162,577評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長呵扛。 經(jīng)常有香客問我每庆,道長,這世上最難降的妖魔是什么今穿? 我笑而不...
    開封第一講書人閱讀 58,176評論 1 292
  • 正文 為了忘掉前任缤灵,我火速辦了婚禮,結(jié)果婚禮上蓝晒,老公的妹妹穿的比我還像新娘腮出。我一直安慰自己,他們只是感情好芝薇,可當(dāng)我...
    茶點故事閱讀 67,189評論 6 388
  • 文/花漫 我一把揭開白布胚嘲。 她就那樣靜靜地躺著,像睡著了一般剩燥。 火紅的嫁衣襯著肌膚如雪慢逾。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,155評論 1 299
  • 那天灭红,我揣著相機與錄音侣滩,去河邊找鬼。 笑死变擒,一個胖子當(dāng)著我的面吹牛君珠,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播娇斑,決...
    沈念sama閱讀 40,041評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼策添,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了毫缆?” 一聲冷哼從身側(cè)響起唯竹,我...
    開封第一講書人閱讀 38,903評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎苦丁,沒想到半個月后浸颓,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,319評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,539評論 2 332
  • 正文 我和宋清朗相戀三年产上,在試婚紗的時候發(fā)現(xiàn)自己被綠了棵磷。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,703評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡晋涣,死狀恐怖仪媒,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情谢鹊,我是刑警寧澤算吩,帶...
    沈念sama閱讀 35,417評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站撇贺,受9級特大地震影響赌莺,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜松嘶,卻給世界環(huán)境...
    茶點故事閱讀 41,013評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望挎扰。 院中可真熱鬧翠订,春花似錦、人聲如沸遵倦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,664評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽梧躺。三九已至似谁,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間掠哥,已是汗流浹背巩踏。 一陣腳步聲響...
    開封第一講書人閱讀 32,818評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留续搀,地道東北人塞琼。 一個月前我還...
    沈念sama閱讀 47,711評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像禁舷,于是被迫代替她去往敵國和親彪杉。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,601評論 2 353

推薦閱讀更多精彩內(nèi)容