GWAS:表型的標準化(the normalization of phenotype)

GWAS表型的標準化方法一般有Quantile normalization、Inverse rank normalization、Z-score normalization等蝎抽。

各自區(qū)別如下:

一、Quantile normalization

該方法將每個樣本中表型值進行排序着降,然后將其規(guī)范化到一個標準分布技矮,通常是正態(tài)分布。規(guī)范化是通過將每個樣本的分布等同于目標分布來完成的估脆,使得同樣比例的樣本落在目標分布的每個值下方钦奋、上方或相等。這種方法確保了所有樣本中表型的分布是一致的疙赠。
優(yōu)點:可以消除由于偏斜導致的數(shù)據(jù)極端值和異常值的影響付材,而且對小批量數(shù)據(jù)的處理效果比較好。

使用該方法進行表型標準化的文章有:

1. Genome-wide association studies of brain imaging phenotypes in UK Biobank[J]. Nature, 2018, 562(7726): 210-216.

To ameliorate this, we quantile-normalized each of the image-derived phenotypes (IDPs) before association testing. This transformation also helped to avoid undue influence of outlier values.
https://www.nature.com/articles/s41586-018-0571-7

2. A multiple-phenotype imputation method for genetic studies[J]. Nature genetics, 2016, 48(4): 466-472.

Traits were mean and variance standardized and quantile normalized before analysis.
https://www.nature.com/articles/ng.3513

3. Components of genetic associations across 2,138 phenotypes in the UK Biobank highlight adipocyte biology[J]. Nature communications, 2019, 10(1): 4064.

We applied quantile normalization for phenotype (--pheno-quantile-normalize option), where we fit a linear model with covariates and transform the phenotypes to normal distribution N(0,1).
https://www.nature.com/articles/s41467-019-11953-9

二圃阳、Inverse rank normalization

一種將數(shù)據(jù)轉(zhuǎn)換為正態(tài)分布的方法厌衔。該方法按照數(shù)據(jù)的大小對其進行排序,并將它們轉(zhuǎn)換為百分位(即在所有數(shù)據(jù)中占據(jù)的位置百分比)捍岳,并使用累積分布函數(shù)將這些百分位值轉(zhuǎn)換為標準正態(tài)分布中的z分數(shù)富寿。因此睬隶,排名越靠前的數(shù)據(jù)將被映射到較大的正態(tài)分布的值,排名越靠后的數(shù)據(jù)將被映射到較小的正態(tài)分布的值页徐。這種方法適用于數(shù)據(jù)集中有許多離群值或非正態(tài)分布時苏潜,它可以將數(shù)據(jù)的分布形態(tài)轉(zhuǎn)化為近似正態(tài)分布,方便后續(xù)的統(tǒng)計分析变勇。

使用該方法進行表型標準化的文章有:

Association analyses of 249,796 individuals reveal 18 new loci associated with body mass index[J]. Nature genetics, 2010, 42(11): 937-948.

BMI was adjusted for age, age2 and other appropriate covariates (for example, principal components) and inverse normally transformed to a mean of 0 and a standard deviation of 1.
https://www.nature.com/articles/ng.686

三恤左、Z-score normalization

該方法是通過計算每個樣本的Z-score來標準化所有樣本中觀察到的表型值。Z-score 測量了一個特定樣本的表型與所有樣本的均值表型值相差多少個標準差搀绣。這種方法允許比較不同單位或量表的表型飞袋。

使用該方法進行表型標準化的文章有:

A genome-wide association study in 19 633 Japanese subjects identified LHX3-QSOX2 and IGF1 as adult height loci[J]. Human molecular genetics, 2010, 19(11): 2303-2312.

The scores were then normalized as Z scores. The effects of the Z scores on height were evaluated using the multivariate linear regression model incorporating height as a dependent variable and the Z scores, gender and age as the independent variables, using R statistical software. Differences in height between the subjects with low Z scores (less than or equal to ?2) and high Z scores (≥2) were obtained by comparing the means of the non-adjusted height between subject groups.
https://academic.oup.com/hmg/article-abstract/19/11/2303/579594

總結(jié)

Quantile normalization 適用于偏態(tài)分布或異常值較多的情況, Inverse rank normalization 在樣本量較小時具有更高的準確性豌熄,Z-score 適用于具有不同單位或量表的表型授嘀,允許比較不同單位或量表的表型。
從我查閱的文獻來看锣险,在GWAS中蹄皱,使用Quantile normalization進行連續(xù)型表型標準化的比較多。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末芯肤,一起剝皮案震驚了整個濱河市巷折,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌崖咨,老刑警劉巖锻拘,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異击蹲,居然都是意外死亡署拟,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門歌豺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來推穷,“玉大人,你說我怎么就攤上這事类咧÷澹” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵痕惋,是天一觀的道長区宇。 經(jīng)常有香客問我,道長值戳,這世上最難降的妖魔是什么议谷? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮堕虹,結(jié)果婚禮上卧晓,老公的妹妹穿的比我還像新娘叶洞。我一直安慰自己,他們只是感情好禀崖,可當我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著螟炫,像睡著了一般波附。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上昼钻,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天掸屡,我揣著相機與錄音,去河邊找鬼然评。 笑死仅财,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的碗淌。 我是一名探鬼主播盏求,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼亿眠!你這毒婦竟也來了碎罚?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤纳像,失蹤者是張志新(化名)和其女友劉穎荆烈,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體竟趾,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡憔购,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了岔帽。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片玫鸟。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖山卦,靈堂內(nèi)的尸體忽然破棺而出鞋邑,到底是詐尸還是另有隱情,我是刑警寧澤账蓉,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布枚碗,位于F島的核電站,受9級特大地震影響铸本,放射性物質(zhì)發(fā)生泄漏肮雨。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一箱玷、第九天 我趴在偏房一處隱蔽的房頂上張望怨规。 院中可真熱鬧陌宿,春花似錦、人聲如沸波丰。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽掰烟。三九已至爽蝴,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間纫骑,已是汗流浹背蝎亚。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留先馆,地道東北人发框。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像煤墙,于是被迫代替她去往敵國和親梅惯。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容