網(wǎng)頁(yè)方式easyGWAS
1够委、創(chuàng)建并登陸一個(gè)easyGWAS帳戶;
2肃叶、一個(gè)物種和一個(gè)數(shù)據(jù)集蹂随,以及一個(gè)基因注釋集(可選)。例如:選擇物種擬南芥因惭、數(shù)據(jù)集AtPolyDB(調(diào)用方法 75岳锁,Horton 等人)和基因注釋集基因注釋 (TAIR9);
3蹦魔、選擇一個(gè)表型激率,總共可以選擇 5 種表型,在本教程中勿决,我們通過鍵入名稱來選擇兩種表型LD和LDV乒躺;
4、表型分布的直方圖和 Shapiro-Wilk 檢驗(yàn)的 p 值低缩,Shapiro-Wilk 檢驗(yàn)檢驗(yàn)數(shù)據(jù)來自正態(tài)分布的原假設(shè)嘉冒,Log10轉(zhuǎn)換
5、可以在實(shí)驗(yàn)中添加協(xié)變量或主成分。但是健爬,此步驟是可選的控乾,在本教程中,我們通過單擊“繼續(xù)”來跳過它娜遵。
6蜕衡、可以選擇所有可用的 SNP 進(jìn)行分析,也可以選擇一組染色體设拟;
7慨仿、必須選擇要用于分析的算法和過濾器。首先纳胧,我們選擇10% 的次要等位基因頻率過濾器镰吆。接下來,我們?yōu)槊總€(gè)表型選擇算法EMMAX并單擊繼續(xù)跑慕;
8万皿、可以通過單擊Submit GWAS將 GWAS 提交到計(jì)算服務(wù)器。
9核行、計(jì)算完成后我們將通過電子郵件收到通知牢硅。
上傳的文件格式
存儲(chǔ)基因型數(shù)據(jù)需要兩個(gè)文件:PED 和 MAP 文件。
PED 文件開頭有 6 個(gè)固定列芝雪,后跟 SNP 信息减余。各列應(yīng)由空格或制表符分隔。前六列包含以下信息:
家庭 ID(如果未知惩系,請(qǐng)使用與第二列中的樣本 ID 相同的 ID)
樣品編號(hào)
父親 ID(如果未知位岔,請(qǐng)使用 0)
母親 ID(如果未知,請(qǐng)使用 0)
性別(如果未知?jiǎng)t使用 0)
未使用堡牡,設(shè)置為0
其余列:SNP
MAP 文件包含有關(guān)每個(gè) SNP 的信息抒抬。每一行對(duì)應(yīng) PED 文件中的一個(gè) SNP;SNP 的順序必須與 PED 文件中的順序相同悴侵,即 MAP 文件中的行順序必須與 PED 文件中的列匹配(從第 7 列開始)
MAP 文件必須恰好有四列瞧剖,其中包含以下信息(各列應(yīng)以空格或制表符分隔):
染色體 ID(例如 Chr1 代表染色體 1)
唯一的 SNP 標(biāo)識(shí)符
基因組距離(如果未知?jiǎng)t使用 0)
單核苷酸多態(tài)性 (SNP) 位置
R語言跑GWAS
https://www.r-bloggers.com/2017/10/genome-wide-association-studies-in-r/