原創(chuàng) 陳文燕 bio生物信息 2019-04-28
關(guān)于選用多少個(gè)PCA做群體分層校正,各大期刊并沒(méi)有一個(gè)統(tǒng)一的說(shuō)法。故做了如下綜述。
1 隨心所欲型,想選多少就選多少
PCA想選多少就選多少访锻,這個(gè)真的不是開(kāi)玩笑。有文獻(xiàn)有真相通贞!
比如下面文獻(xiàn)直接選用10個(gè)PCA校正群體分層朗若。
Largest GWAS of PTSD (N=20070) yields genetic overlap with schizophrenia and sex differences in heritability
比如選用前5個(gè)主成分校正群體分層。
Accounting for Population Stratification in Practice: A Comparison of the Main Strategies Dedicated to Genome-Wide Association Studies
比如選用前3個(gè)主成分校正群體分層昌罩。
GWAS identifies novel SLE susceptibility genes and explains the association of the HLA region
比如選用前2個(gè)主成分校正群體分層哭懈。
GWAS analysis of suicide attempt in schizophrenia: Main genetic effect and interaction with early life trauma
2 通過(guò)EIGENSTRAT軟件確定顯著的主成分
通過(guò)EIGENSTRAT軟件確定顯著的主成分的思路是這樣的:
2.1 通過(guò)EIGENSTRAT軟件計(jì)算主成分
2.2 計(jì)算各個(gè)主成分是否有顯著的統(tǒng)計(jì)學(xué)意義
2.3 將P值小于0.05的主成分納入群體分層校正中
如下圖所示,主成分1和2是顯著影響群體結(jié)構(gòu)的(P<0.05)茎用,做關(guān)聯(lián)分析時(shí)則被納入?yún)f(xié)變量中遣总。
此類(lèi)做法參考文獻(xiàn):
GWAS Identifies Novel Susceptibility Loci on 6p21.32 and 21q21.3 for Hepatocellular Carcinoma in Chronic Hepatitis B Virus Carriers