之前我寫過一篇文章群體遺傳分析分層校正,該選用多少個PCA?澡腾,里面提到可以通過EIGENSTRAT軟件確定顯著的主成分凯亮,后續(xù)就可以將顯著的主成分加入?yún)f(xié)變量中。
這篇文章主要是講如何通過EIGENSTRAT軟件確定顯著的主成分须尚。
1下載安裝EIGENSTRAT
1.1 下載
下載地址:https://data.broadinstitute.org/alkesgroup/EIGENSOFT/EIG-6.1.4.tar.gz
wget https://data.broadinstitute.org/alkesgroup/EIGENSOFT/EIG-6.1.4.tar.gz
1.2 安裝
tar zxvf EIG-6.1.4.tar.gz
2 PCA計算
可以用plink計算PCA崖堤,也可以用EIGENSTRAT。
PLINK計算PCA比較簡便耐床,個人比較推薦PLINK密幔。
之前已經(jīng)介紹過怎么用PLINK計算PCA了,這里就不再贅述撩轰。
3 確定顯著PCA數(shù)量
下面講一下怎么用EIGENSTRAT確定多少個PCA被納入?yún)f(xié)變量中胯甩。
3.1 如果是用EIGENSTRAT計算得到的PCA
用EIGENSTRAT計算得到后綴為.eval
的文件后昧廷,使用如下命令:
/bin/twstats -t twtable -i pca.eval -o eigenvaltw.out
3.2 如果是用PLINK計算得到的PCA
用PLINK計算的PCA得到后綴為.eigenval
的文件后,使用如下命令:
/bin/twstats -t twtable -i pca.eigenval -o eigenvaltw.out
3.3 結(jié)果解讀
假定生成的eigenvaltw.out如下:
Z3eu7D.png
這張圖里前三個PCA的P值小于0.05偎箫,說明做關(guān)聯(lián)分析的時候要把前三個PCA加入?yún)f(xié)變量中木柬。