TASSEL利用固定效應(yīng)線性模型來測(cè)試分離位點(diǎn)和表型之間的關(guān)聯(lián)。該分析可以選擇使用指示基礎(chǔ)總體成員程度的協(xié)變量來考慮總?cè)航Y(jié)構(gòu)痕届。僅主效應(yīng)模型是使用輸入數(shù)據(jù)中的所有變量自動(dòng)構(gòu)建的。為每個(gè)特征和標(biāo)記組合構(gòu)建并求解一個(gè)單獨(dú)的模型。任何因子宫补、協(xié)變量盛撑、代表或位置都作為主效應(yīng)包含在每個(gè)模型中碎节。數(shù)據(jù)的使用方式必須在輸入數(shù)據(jù)文件中定義,或者在導(dǎo)入數(shù)據(jù)后但在數(shù)據(jù)與基因型連接之前使用性狀過濾器定義抵卫。
這里狮荔,SNP作為固定因子,可以考慮其它協(xié)變量(比如性別介粘,PCA殖氏,群體結(jié)構(gòu)等等)
GLM模型中,將每個(gè)SNP作為固定因子進(jìn)行回歸分析姻采,進(jìn)行顯著性檢驗(yàn)雅采,P值就是GWAS分析的p-value,effect就是SNP的effect值慨亲。如果有其它因素需要考慮婚瓜,就放到協(xié)變量里面,比如性別刑棵,PCA巴刻,Q矩陣等。
重點(diǎn)是對(duì)每個(gè)SNP做回歸分析蛉签,提取effect和p-value冈涧。
數(shù)據(jù)準(zhǔn)備
表型數(shù)據(jù):sample.table
Q矩陣:snp.3.Q
vcf文件:all_snp.vcf
參考腳本
#軟件安裝
conda install tassel
#gwas_glm
run_pipeline.pl -Xms512m -Xmx50g \ #設(shè)置內(nèi)存大小
-fork1 -vcf ./all_snp.vcf \ #vcf文件
-fork2 -t sample.table \#表型數(shù)據(jù)
-fork3 -q snp.3.Q -excludeLastTrait \ #Q矩陣
-combine4 -input1 -input2 -input3 -intersect \ #數(shù)據(jù)取交集
-FixedEffectLMPlugin -endPlugin \ #進(jìn)行g(shù)lm分析
-export glm_output
輸出結(jié)果
glm_output1.txt
glm_output2.txt
結(jié)果繪圖
#提取繪圖文件
awk '{print $2"\t"$3"\t"$4"\t"$6}' glm_output1.txt > glm_output.manht_input
Rscript ./manhattan_cmplot.R glm_output.manht_input glm_output.manht_figure