全基因組關(guān)聯(lián)分析(GWAS)-基本分析內(nèi)容

1淹父、GWAS 流程

image.png

數(shù)據(jù)質(zhì)控
? 1)按分型百分比條件過(guò)濾,多數(shù)文章剔除缺失率在20%以上的位點(diǎn),樣本量較大的群體中步脓,可以將缺失率小于50%的位點(diǎn)都保留罗捎;
? 2)按等位基因頻率過(guò)濾观谦,通常去除第二等位基因頻率小于5%的位點(diǎn),樣本量較大的群體中桨菜,可以降低到1%坎匿;
? 3)多等位位點(diǎn)的過(guò)濾(適應(yīng)軟件);
? 4)哈迪溫伯格平衡過(guò)濾雷激,一般無(wú)法使用較為復(fù)雜的統(tǒng)計(jì)模型的情況使用替蔬,如人類(lèi)的 Case/Control GWAS 中一般將不符合哈迪溫伯格平衡的位點(diǎn)過(guò)濾掉,植物GWAS中一般不過(guò)濾屎暇;
? 5)極端表型的去除承桥。
LD 衰減分析
? 確定使用的群體的LD衰減距離,判斷使用的標(biāo)記代表性
? 最低飽和標(biāo)記量 = 基因組大小/LD衰減距離
? 越密越好:檢測(cè)到功能位點(diǎn)的概率增大根悼;處于同一個(gè)Block的位點(diǎn)相互驗(yàn)證
(Manhattan plot 柱狀峰值)
image.png

群體結(jié)構(gòu)與親緣關(guān)系的評(píng)估
? 群體結(jié)構(gòu)和親緣關(guān)系是導(dǎo)致關(guān)聯(lián)結(jié)果出現(xiàn)假陽(yáng)性的兩個(gè)主要因素
? 對(duì)群體結(jié)構(gòu)和親緣關(guān)系進(jìn)行評(píng)估以確定使用的統(tǒng)計(jì)模型和獲得相應(yīng)的矩陣
image.png

群體結(jié)構(gòu)對(duì)GWAS結(jié)果的影響
image.png

基因型與群體結(jié)構(gòu)關(guān)聯(lián)
image.png

群體結(jié)構(gòu)評(píng)估的內(nèi)容
image.png

親緣關(guān)系的評(píng)估內(nèi)容
image.png

樣本清除
? 根據(jù)群體結(jié)構(gòu)和親緣關(guān)系的評(píng)估結(jié)果對(duì)可能影響結(jié)果的樣本進(jìn)行去除
? 1)遺傳上與絕大多少樣品差異極大樣品應(yīng)當(dāng)剔除凶异;
? 2)親緣關(guān)系非常近的兩個(gè)材料可以只保留一個(gè)。
關(guān)聯(lián)分析
? 選擇正確的統(tǒng)計(jì)方法進(jìn)行關(guān)聯(lián)分析
? 1)小標(biāo)記量候選基因關(guān)聯(lián)分析:可以選擇比較簡(jiǎn)單的t-test或者ANOVA挤巡;
? 2)Case/Control-質(zhì)量性狀:卡平方檢驗(yàn)剩彬,OR檢驗(yàn),邏輯回歸矿卑,也可以視為數(shù)
量性狀使用較為復(fù)雜的線性模型喉恋;
? 3)數(shù)量性狀:根據(jù)群體結(jié)構(gòu)評(píng)估的情況,選用相應(yīng)的模型母廷,但在實(shí)際操作中一
般使用多種模型(GLM/MLM/EMMAX/FaST-LMM)同時(shí)分析轻黑,根據(jù)結(jié)果進(jìn)
行取舍
GLM
image.png

MLM
image.png

關(guān)聯(lián)分析模型與軟件
image.png

選擇: GLM/MLM/CMLM為基礎(chǔ)( TASSEL/GAPIT) , 與EMMAx琴昆、 Fast-LMM相互比較氓鄙, 其他作為補(bǔ)充,當(dāng)性狀與群體結(jié)構(gòu)相關(guān)時(shí)业舍, 可以考慮使用FarmCPU
顯著性閾值確定
image.png

2抖拦、結(jié)果解讀

曼哈頓圖(Manhattan plot)
分位點(diǎn)-分位點(diǎn)圖(Quantile-Quantile plot)

image.png

可喜的結(jié)果
image.png

遺憾的結(jié)果
image.png

可能原因:性狀考察不準(zhǔn)確升酣;性狀受環(huán)境影響大;該性狀由多個(gè)小效應(yīng)位點(diǎn)控制态罪,可增加樣本量提高檢測(cè)效力(Power)噩茄;模型的檢測(cè)效力問(wèn)題;標(biāo)記密度不夠向臀;性狀的變異是由表觀修飾引起的巢墅,與基因型無(wú)關(guān)
挽救方法:提供準(zhǔn)確的表型數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析;多年多點(diǎn)重復(fù)券膀;增加樣本量君纫;增加標(biāo)記量;更換模型芹彬;忽略閾值蓄髓,選擇有明顯的峰值區(qū)域進(jìn)行驗(yàn)證
問(wèn)題結(jié)果
image.png

后續(xù)的生物信息學(xué)分析
? 獲得顯著位點(diǎn)后,從生物信息學(xué)的角度還可以進(jìn)行如下分析:
? 1)對(duì)顯著位點(diǎn)附近進(jìn)行LD Block分析舒帮,確定候選區(qū)間的范圍会喝;
? 2)對(duì)候選區(qū)間內(nèi)的基因進(jìn)功能注釋(包括nr,GO玩郊,KEGG等)肢执;
? 3)顯著位點(diǎn)是否位于編碼區(qū),是否引起編碼氨基酸的改變译红;
? 4)同源分析预茄,結(jié)合其他物種對(duì)應(yīng)的同源基因的功能猜測(cè)候選基因的功能
后續(xù)實(shí)驗(yàn)驗(yàn)證
材料:舉例-381份粳稻品種(熱帶和溫帶品種)
1、關(guān)于水稻谷粒大小的性狀侦厚,GWAS定位到7號(hào)染色體耻陕,SNP峰值所在地方注釋到11個(gè)基因;
2刨沦、對(duì)11個(gè)基因分別在稻穗诗宣、葉片和根系中做RT-PCR,只有第9個(gè)基因OsSPL13在稻穗中表達(dá)有差異想诅;
3召庞、OsSPL13基因蛋白表達(dá)的進(jìn)一步驗(yàn)證;
4侧蘸、分析OsSPL13基因在水稻大粒和小粒之間的序列差異裁眯,包括SNP位點(diǎn)和小的indel;
5讳癌、通過(guò)轉(zhuǎn)基因找到影響OsSPL13基因表達(dá)相關(guān)的相關(guān)區(qū)域(5’UTR中的一個(gè)串聯(lián)重復(fù)序列);
6存皂、通過(guò)RNA干擾的方法將大粒品種GP579和小粒品種Dongjing中OsSPL13的表達(dá)量下調(diào)后會(huì)使水稻籽粒的長(zhǎng)度和粒重都顯著降低晌坤;
7逢艘、篩選到1個(gè)Dongjing來(lái)源的glw7突變體,粒長(zhǎng)和粒重比野生型均明顯降低骤菠;
8它改、通過(guò)chip-seq進(jìn)行OsSPL13調(diào)節(jié)下游基因的驗(yàn)證(結(jié)果未示)SRS5和DEP1。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末商乎,一起剝皮案震驚了整個(gè)濱河市央拖,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌鹉戚,老刑警劉巖鲜戒,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異抹凳,居然都是意外死亡遏餐,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)赢底,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)失都,“玉大人,你說(shuō)我怎么就攤上這事幸冻〈馀樱” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵洽损,是天一觀的道長(zhǎng)庞溜。 經(jīng)常有香客問(wèn)我,道長(zhǎng)趁啸,這世上最難降的妖魔是什么强缘? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮不傅,結(jié)果婚禮上旅掂,老公的妹妹穿的比我還像新娘。我一直安慰自己访娶,他們只是感情好商虐,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著崖疤,像睡著了一般秘车。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上劫哼,一...
    開(kāi)封第一講書(shū)人閱讀 49,111評(píng)論 1 285
  • 那天叮趴,我揣著相機(jī)與錄音,去河邊找鬼权烧。 笑死眯亦,一個(gè)胖子當(dāng)著我的面吹牛伤溉,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播妻率,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼乱顾,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了宫静?” 一聲冷哼從身側(cè)響起走净,我...
    開(kāi)封第一講書(shū)人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎孤里,沒(méi)想到半個(gè)月后伏伯,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡扭粱,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年舵鳞,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片琢蛤。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡蜓堕,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出博其,到底是詐尸還是另有隱情套才,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布慕淡,位于F島的核電站背伴,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏峰髓。R本人自食惡果不足惜傻寂,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望携兵。 院中可真熱鬧疾掰,春花似錦、人聲如沸徐紧。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)并级。三九已至拂檩,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間嘲碧,已是汗流浹背稻励。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留愈涩,地道東北人钉迷。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓至非,卻偏偏與公主長(zhǎng)得像钠署,于是被迫代替她去往敵國(guó)和親糠聪。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 最喜歡看的電影電視劇有兩種谐鼎,一是高評(píng)分有內(nèi)容有技巧的好片舰蟆,一是全程靠著無(wú)腦對(duì)話拼湊起來(lái)的消遣片。奇怪的是狸棍,從高質(zhì)量...
    蘭子的字閱讀 336評(píng)論 0 2
  • 對(duì)記憶力不好的人來(lái)說(shuō)身害,找東西就像和過(guò)去的自己來(lái)一場(chǎng)隨機(jī)性的捉迷藏游戲。 這段時(shí)間不知道是由于工作繁...
    SHE林閱讀 210評(píng)論 4 2
  • 朋友找我吃飯草戈,吃著聊著話題轉(zhuǎn)到了女朋友上塌鸯。 “明天教師節(jié)誒,你準(zhǔn)備了什么禮物給你的老師女朋友呀唐片?” 我看著他丙猬,失神...
    c5df7d4f71a4閱讀 353評(píng)論 0 0
  • 今天老師講的是I2C通訊里面的mcp23008的應(yīng)用。主要還是的還是節(jié)省資源费韭,可以最大程度的利用主芯片的管腳來(lái)實(shí)現(xiàn)...
    胡英杰1984閱讀 159評(píng)論 0 0