想使用一組已經(jīng)是bed bim fam,在R語言中進(jìn)行操作湿颅。
bed文件是一個(gè)二進(jìn)制文件撮胧,看不到
bim文件總共有六行,包含了snp(variants)的具體信息讥巡,也就是geno信息
1.第一列是染色體信息
2.第二列是snp的名字
3.第三列是摩爾距離掀亩,文件中說可以用0,沒關(guān)系
4.第四列是物理距離
5.第五列是次要等位基因
6.第六列是主要等位基因
fam文件記錄個(gè)體信息欢顷,類似pheno信息
#轉(zhuǎn)化為ped槽棍,map文件
plink --bfile 1-Stoort --recode --out 1-Stoort
#轉(zhuǎn)化為0,1,2文件炼七,信息在.raw文件中
plink --bfile 1-Stoort --recodeA --out 1-Stoort
我們通過R語言提取fam文件的一定列數(shù)缆巧。再用plink將bed,bim等文件補(bǔ)齊豌拙,也就是對(duì)應(yīng)抽取fam文件的相對(duì)應(yīng)文件陕悬。
plink --bfile 1-Stoort --keep new.txt --make-bed --out new
plink --bfile 1-Stt --keep new.txt --chr 1 --make-bed --out new_200_chr1#如果只想要第六個(gè)染色體的信息
#去掉連鎖不平衡的snp位點(diǎn)
plink --bfile new --indep-pairwise 100 10 0.1
#保存下來篩選過后的信息
plink --bfile new_200_chr1 --extract plink.prune.in --make-bed --out prunedata
recode生成的raw文件有:FID IID PAT MAT SEX PHENOTYPE snp1 snp2 .....的信息