SNP分析命令

E:\ > cd e:
E:
E:\ > cd plink-1
E:\plink-1>plink –file test

  1. Map 更新
    Plink --goat --file data --update-map position.txt --recode --out data1
    Chrnew.txt -- update-chr --recode --out data2
    Position: SNP code and position
    Chrnew:SNP code and Chr.
    2.SNP merge
    Plink --file data1 --merge data2.ped data2.map --recode --out merge
    3.提取SNP位點(diǎn)
    Plink --file data --extract 50kSNP.txt --recode --out data1
    50kSNP.txt: 50k中的SNP名
  2. Quality control
    Call rate >98%/99%
    Plink --file goat --geno 0.02 --recode --out goatgeno
    Plink --file goatgeno --mind 0.01 --recode --out goatmind
    MAF>0.05
    Plink --file goatmind --maf 0.05 --recode --out goatmaf
    Hardy-Weinberg equilibrium <0.0001
    Plink --file goatmaf --hwe 0.0001 --recode --out goathwe
    Exclude the SNP markers with either chromosome or both unknown
    Plink --goat --file goathwe --extract 4newsnp.txt --recode --out goat4
    Note: 制作4newsnp.txt(包含 chromosome 和 base-pair position 都為0的SNP)
    To identify sample duplication or half-sibs or closer
    Plink –goat –file goat4 –genome –max 0.85
    Note:Check the genome file
  3. LD quality control
    Plink –goat --file goat4 –indep-pairwise 100 25 0.2 –out goatld0.2
    Plink --goat --file goat4 --indep-pairwise 100 25 0.05 --out goatld0.05
    Plink --file goat4 --ld-window-r2 0.2 --out goatldr0.2
    輸出結(jié)果為 data prunein 和 data prune out
    (質(zhì)控時(shí)纯陨,要去除X染色體)
    將data prune in 轉(zhuǎn)化為ped和map
    Plink --goat --file 114hwe --extract 114goat0.05.prune.in --recode --out goatforpca
  4. PCA-
    PCA的三個(gè)文件:
    Plink --goat --file data(生成LD的文件) --extract data (LD).prune.in --recode --out goatforpca
    1goatforpca.ped 改為5.ped
    2goatforpca.map 改為5.pedsnp
    3將goatforpca 制作成二進(jìn)制文件 輸出5b
    plink --file hapmap1 --make-bed --out hapmap1
    結(jié)果為5b.farm即為ped文件的前6列偿衰, 將5b.farm 改名為5.pedind
    Note: 5.pedind 文件中要將第六列-9換成familyID.
    參數(shù)文件
    Genotypename: 5.ped
    Snp name: 5.pedsnp
    Indivame: 5.pedind
    Evecoutname: 5.pca.evec
    Evaloutname: 5.eval
    Altnormstyle: NO
    Numoutevec: 3
    Numoutlieriter: 5
    Numoutlierevec: 10
    Outlier sigmathresh: 6.0
    Qt mode: NO
    將上述文件拷貝到eigensoft/bin 文件夾內(nèi)
    打開(kāi)命令
    Cd EIG5.01/bin
    作圖命令
    ./smartpca –p 5.par
    ./ploteig –I 5.pca.evec –c 1:2 –p AL:BSB:…Tiberan –x 5-0
    即可得到PCA
    在5.pca.evec文件中可以看到主成分占的比例。
    7 原始SNP數(shù)據(jù)轉(zhuǎn)化成map和ped文件

data=read.csv("E:/SNP/zang.csv") (data=read.csv("E:/SNP/chicken.csv")
Ta=t(data)
write.table(Ta,file="E:/snp/1.txt", quote=FALSE, sep=" ", na="0")
檢查命令:--Compound –genotypes
8: 近交系數(shù)計(jì)算, 多態(tài)性含量, Ho He 哈溫P值)
plink --file filename --het --out filename1
plink --file filename --homozyg --out filename1
plink --file filename --hardy --out filename1(Plink --file filename –hardy女蜈, 結(jié)果為plink.hwe)
9: ADZE軟件計(jì)算Ar 和 pAr
Plink 轉(zhuǎn)化成structure
1Plink --file filename --recode-structure --out filename1
2用PGDspider 轉(zhuǎn)化ped 文件為structure結(jié)構(gòu)虐拓。
將plink轉(zhuǎn)化的位點(diǎn)信息粘貼到PGDspider轉(zhuǎn)化的文件中
全基因組關(guān)聯(lián)分析
plink --file data --remove mylist.txt --recode --out filename
plink --goat --file filename --out name –assoc
plink --goat --file filename --out name --assoc --adjust
R軟件中繪制manhattan 圖
先安裝qqman軟件
library(qqman)
results<- read.table("D:/plink/plink1/plink.assoc",T)
manhattan(results, ylim = c(0, 10), col = c("blue4", "orange3"))
R軟件中繪制qq-plot圖
library(qqman)
results<- read.table("D:/plink/plink1/plink.assoc",T)
qq(results$P)
用其他關(guān)聯(lián)分析方法:
plink --goat --file mar --out mar-model --model --model-trend --adjust
LD 分析(haploview)
1 info 文件生成:plink --file hu-M2 --recodeHV --out hu-M2HV
R 安裝 GenABEL
Install packages (GenABEL)
Install packages (MASS)
Install packages(Gen ABEL.data)
加載安裝包
Library (MASS)
Library(Gen ABEL.data)
Library(GenABEL)
在使用GenABEL前需要準(zhǔn)備4個(gè)文件
Ped沼沈、map、phen(當(dāng)ped中含有多個(gè)表型時(shí)用到)嘱函、praw
1生成tped甘畅、tfram 文件
Plink –file name –transpose –recode –out gwa-gabel
當(dāng)多個(gè)表型時(shí)還還需要—pheo phenol.phen –pheno-name
2制作praw文件
格式 id sex phen(sex:female=0, male=1 phen case=1 control=0)
“Sss12” 1 0
“Sss18” 1
1 GLM test
Testb<- scan.glm(‘phen~CRSNP’, family=binomial(),data=b.dat)
2 score test
Testb.qt<- qtscore(phen, data=b.dat, trait=”binomial”)
Test.qt@lambda

格式轉(zhuǎn)化:
1 二進(jìn)制格式轉(zhuǎn)為 tped/tfam 或 ped/map

用bfile來(lái)讀取test3.bed,test3.bim和test3.fam文件

生成test4.tped和test4.tfam

plink --bfile test3 --recode --transpose --out test4

生成test5.ped和test5.map

plink --bfile test3 --recode --out test5

  1. Quality control
    Call rate >98%/99%
    Plink --file goat1 --geno 0.02 --recode --out goatgeno
    Plink --file goatgeno --mind 0.01 --recode --out goatmind
    MAF>0.05
    Plink --file goatmind --maf 0.05 --recode --out goatmaf
    Hardy-Weinberg equilibrium <0.0001
    Plink --file goatmaf --hwe 0.0001 --recode --out goathwe
    Exclude the SNP markers with either chromosome or both unknown
    Plink --file goathwe --exclude 4newsnp.txt --recode --out goat4
    Note: 制作4newsnp.txt(包含 chromosome 和 base-pair position 都為0的SNP)
    To identify sample duplication or half-sibs or closer
    Plink –goat –file goat4 –genome –max 0.85
    Note:Check the genome file
  2. LD quality control
    Plink --file goat --indep-pairwise 100 25 0.2 --out goatld0.2
    Plink --goat --file goat --indep-pairwise 100 25 0.05 --out goatld0.05
    Plink --file goat4 --ld-window-r2 0.2 --out goatldr0.2
    輸出結(jié)果為 data prunein 和 data prune out
    (質(zhì)控時(shí)实夹,要去除X染色體)
    將data prune in 轉(zhuǎn)化為ped和map
    Plink --goat --file goat --extract goatld0.05.prune.in --recode --out goatforpca

D:\科研\(zhòng)山羊SNP\SNP分析軟件\plink-1.07-dos

plink --cow --vcf Europeanibex.vcf --recode --out output

山羊分群:

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末橄浓,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子亮航,更是在濱河造成了極大的恐慌荸实,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,470評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件缴淋,死亡現(xiàn)場(chǎng)離奇詭異准给,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)重抖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)露氮,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人钟沛,你說(shuō)我怎么就攤上這事畔规。” “怎么了恨统?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,577評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵叁扫,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我畜埋,道長(zhǎng)莫绣,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,176評(píng)論 1 292
  • 正文 為了忘掉前任悠鞍,我火速辦了婚禮对室,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己掩宜,他們只是感情好蔫骂,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,189評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著锭亏,像睡著了一般纠吴。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上慧瘤,一...
    開(kāi)封第一講書(shū)人閱讀 51,155評(píng)論 1 299
  • 那天戴已,我揣著相機(jī)與錄音,去河邊找鬼锅减。 笑死糖儡,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的怔匣。 我是一名探鬼主播握联,決...
    沈念sama閱讀 40,041評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼每瞒!你這毒婦竟也來(lái)了金闽?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 38,903評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤剿骨,失蹤者是張志新(化名)和其女友劉穎代芜,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體浓利,經(jīng)...
    沈念sama閱讀 45,319評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡挤庇,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,539評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了贷掖。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片嫡秕。...
    茶點(diǎn)故事閱讀 39,703評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖苹威,靈堂內(nèi)的尸體忽然破棺而出昆咽,到底是詐尸還是另有隱情,我是刑警寧澤牙甫,帶...
    沈念sama閱讀 35,417評(píng)論 5 343
  • 正文 年R本政府宣布掷酗,位于F島的核電站,受9級(jí)特大地震影響腹暖,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜翰萨,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,013評(píng)論 3 325
  • 文/蒙蒙 一脏答、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦殖告、人聲如沸阿蝶。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,664評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)羡洁。三九已至,卻和暖如春爽丹,著一層夾襖步出監(jiān)牢的瞬間筑煮,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,818評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工粤蝎, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留真仲,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,711評(píng)論 2 368
  • 正文 我出身青樓初澎,卻偏偏與公主長(zhǎng)得像秸应,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子碑宴,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,601評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 按照前人的教程软啼,跑了跑GWAS流程,作為初學(xué)者延柠,歡迎大家提問(wèn)祸挪,指教。 數(shù)據(jù)來(lái)源:A new regulator o...
    1yon閱讀 3,952評(píng)論 0 10
  • 最近跑通了一遍GWAS分析,全程在linux操作榜跌,雖然具體還有好多需要微調(diào)的地方闪唆,先把代碼整理分享出來(lái)mark一下...
    rapunzel0103閱讀 34,182評(píng)論 45 168
  • 作者:rapunzel0103 鏈接:http://www.reibang.com/p/53362fe881cd...
    大花熊閱讀 9,617評(píng)論 5 25
  • #########################################################...
    bettermaan閱讀 3,030評(píng)論 1 7
  • 傳統(tǒng)的全基因組關(guān)聯(lián)分析(GWAS)計(jì)算的是單個(gè)SNP與表型的相關(guān)性,除此之外钓葫,我們還可以進(jìn)行SNP之間的互作效應(yīng)與...
    橙子牛奶糖閱讀 1,946評(píng)論 2 11