GWAS分析-說(shuō)人話(20)-單倍體關(guān)聯(lián)分析

前言

來(lái)到這里鲁猩,已經(jīng)漸漸不是人話了...

估計(jì)這輩子我也沒(méi)有想到,我把我最厭惡的東西寫(xiě)出來(lái)疹启,

居然是最多人看的......

分析方法很多,這一小節(jié)吐槽官網(wǎng)的這一行代碼户盯,大神請(qǐng)點(diǎn)贊后直接略過(guò)~

plink --bfile mydata --hap-window 3 --hap-assoc


1.背景

我一般不交代“科學(xué)”背景,但是還得“裝”一下饲化。

什么是“Haplotype”莽鸭?

就是你有一堆SNPs,"近朱者赤吃靠,近墨者黑"硫眨,就是要“在一起”遺傳的。

所以Haplotype分析就是要找到這一堆SNPs巢块。

和GWAS分析中常提到的“連鎖”有什么關(guān)系礁阁?

“連鎖”是虛的G珊拧(概率相關(guān)的概念)

單體型是實(shí)的! (物理存在的附近)姥闭。

人話:

“連鎖”法找女朋友全靠算命丹鸿,星座風(fēng)水;

“單倍型”法找女朋友棚品,直接就是你鄰座卜高、鄰居,青梅足馬啊~南片。

2.今天的主角:?jiǎn)伪缎头治觯℉aplotype testing)

道理很簡(jiǎn)單,我們都知道單純靠一個(gè)SNP決定遺傳是不靠譜的~?

(別問(wèn)我為什么知道庭敦,問(wèn)就是100個(gè)位點(diǎn)疼进,你做101個(gè)都未必有陽(yáng)性實(shí)驗(yàn)結(jié)果,在其他人中也驗(yàn)證不出來(lái))

本質(zhì)上秧廉,就像看警匪片伞广,要揪,就把整個(gè)犯罪團(tuán)伙揪出來(lái)疼电!

(非人話地說(shuō):?jiǎn)伪缎头治鲈诙ㄎ患膊『托誀钣嘘P(guān)的基因方面具有更好的功效)

3.今天的吐槽大會(huì):

plink --bfile mydata --hap-window 3 --hap-assoc

前面的:plink --bfile mydata 這里看過(guò)之前的都沒(méi)有問(wèn)題了嚼锄,除非你沒(méi)有看~

后面的這個(gè)?--hap-assoc 也就是單倍型關(guān)聯(lián)分析嘛~

至于中間的這個(gè)“ --hap-window 3” 是什么鬼?

官網(wǎng)寫(xiě)的是這樣的:

to form all 3-SNP haplotypes across the entire dataset (respecting chromosome boundaries, however). In this case the windows will be automatically named?WIN1,?WIN2, etc.?

然后又是這樣的:

This command can take a comma-delimited list of values, e.g.

? ? ?--hap-window 1,2,3

to perform all single SNP tests (1-SNP haplotypes) as well as sliding windows of all 2-SNP and 3-SNP haplotypes.

每個(gè)單詞都懂蔽豺,但是就是看不懂啊~~~~~

放心区丑,這鍋不該英語(yǔ)老師來(lái)背~

要讀懂這里,首先要了解一下:“sliding window”

因?yàn)闆_動(dòng)的后果就是這樣:

ERROR: Problem with specification of haplotype sliding window

sliding:滑行的修陡;window:窗 (簡(jiǎn)單沧侥、總體、多數(shù)情況來(lái)說(shuō)魄鸦,就是你規(guī)定的基因范圍)

sliding window相當(dāng)于就是:

?我設(shè)定SNP個(gè)數(shù)一個(gè)一個(gè)玩宴杀!~~~

即:1就是一個(gè)一個(gè)玩,2就是兩個(gè)兩個(gè)玩拾因,3就是三個(gè)三個(gè)玩M铡!>罴恰扁达!

吐槽:

知道為什么程序員寫(xiě)的“說(shuō)明”都“看不懂”了吧!以來(lái)就三個(gè)庭惜!~~~那么猛罩驻!

具體如下:(注意,不是隨機(jī)組合抽取护赊,是按固定個(gè)數(shù)一直往下走惠遏,“slide”~砾跃,直到走不下去)

6個(gè)SNPs,一個(gè)一個(gè)玩(可以玩6次,6個(gè)windows):

--hap-window 1的情況既結(jié)果节吮,看SNP一列就是1個(gè)1個(gè)SNP來(lái)

6個(gè)SNPs,三個(gè)三個(gè)玩(可以玩4次抽高,4個(gè)windows):

--hap-window 1的情況既結(jié)果,看SNP一列就是3個(gè)3個(gè)SNP來(lái)

6個(gè)SNPs,五個(gè)五個(gè)玩(只能玩2次透绩,2個(gè)windows):


--hap-window 1的情況既結(jié)果翘骂,看SNP一列就是5個(gè)5個(gè)SNP來(lái)

例子夠了吧?還不點(diǎn)贊帚豪?

其實(shí)碳竟,吐槽完了,plink還是挺“銀杏”的~

只要你在 --hap-window 中用逗號(hào)這樣分開(kāi)“1,2,3”(?--hap-window 1,2,3)狸臣,就會(huì)給出1莹桅,2,3各種情況時(shí)的結(jié)果烛亦,如下:

1個(gè)诈泼,2個(gè),3個(gè)煤禽,各種情況的玩~

所以铐达,

plink --bfile mydata --hap-window 3 --hap-assoc,

你學(xué)廢了嗎檬果?

后記:

目前文獻(xiàn)瓮孙,把基本關(guān)聯(lián)做完了以后,就常規(guī)做一個(gè)LD檢驗(yàn)选脊,之后就繼續(xù)做單體型與疾病關(guān)聯(lián)分析衷畦,然而這個(gè)后續(xù)的單體型與疾病關(guān)聯(lián)分析,并不以前面的LD所分辨出來(lái)的BLOCK為基礎(chǔ)知牌,而是他做了多少個(gè)SNP祈争,就用多少個(gè)SNP一起做單體型與疾病關(guān)聯(lián)分析

實(shí)現(xiàn)這里的“用多少個(gè)SNP一起做單體型與疾病關(guān)聯(lián)分析”角寸,就是在這一小節(jié)之前使用extract提取你要的SNP文件(具體參考:)菩混,如6個(gè)SNPs(注意這個(gè)snps.txt,就是一個(gè)一列扁藕,沒(méi)有列名的沮峡,想要提取snp名字的txt文件!不要想復(fù)雜了?):

plink --noweb --bfile data --extract snps.txt --recode --make-bed --out 6snps

然后這個(gè)6snp文件就是你的mydata文件亿柑。

不寫(xiě)了邢疙,反正你們也不會(huì)點(diǎn)贊的~

參考文獻(xiàn):

1.提升SNP和單倍體認(rèn)識(shí)逼格:http://doc.aporc.org/attach/Course001/Bioinformatics-3.pdf

2.大神討論:https://www.dxy.cn/bbs/newweb/pc/post/20879971

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子疟游,更是在濱河造成了極大的恐慌呼畸,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件颁虐,死亡現(xiàn)場(chǎng)離奇詭異蛮原,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)另绩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)儒陨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人笋籽,你說(shuō)我怎么就攤上這事蹦漠。” “怎么了车海?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵津辩,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我容劳,道長(zhǎng),這世上最難降的妖魔是什么闸度? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任竭贩,我火速辦了婚禮,結(jié)果婚禮上莺禁,老公的妹妹穿的比我還像新娘留量。我一直安慰自己,他們只是感情好哟冬,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布楼熄。 她就那樣靜靜地躺著,像睡著了一般浩峡。 火紅的嫁衣襯著肌膚如雪可岂。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,624評(píng)論 1 305
  • 那天翰灾,我揣著相機(jī)與錄音缕粹,去河邊找鬼。 笑死纸淮,一個(gè)胖子當(dāng)著我的面吹牛平斩,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播咽块,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼绘面,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起揭璃,我...
    開(kāi)封第一講書(shū)人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤晚凿,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后塘辅,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體晃虫,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年扣墩,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了哲银。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡呻惕,死狀恐怖荆责,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情亚脆,我是刑警寧澤做院,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站濒持,受9級(jí)特大地震影響键耕,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜柑营,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一屈雄、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧官套,春花似錦酒奶、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至站刑,卻和暖如春另伍,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背绞旅。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工质况, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人玻靡。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓结榄,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親囤捻。 傳聞我的和親對(duì)象是個(gè)殘疾皇子臼朗,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355