孟德爾隨機化(Mendelian Randomization) 統(tǒng)計功效(power)和樣本量計算

1 統(tǒng)計功效(power)概念

統(tǒng)計功效(power)指的是在原假設(shè)為假的情況下濒旦,接受備擇假設(shè)的概率再登。

用通俗的話說就是锉矢,P<0.05時,結(jié)果顯著(接受備擇假設(shè)); 在此結(jié)論下灯节,我們有多大的把握堅信結(jié)果的顯著性绵估,此時需要用到power來表示這種“把握”。

統(tǒng)計功效(power)的計算公式為 1-β形入。

說到β唯笙,要提一下假設(shè)檢驗中的一型錯誤和二型錯誤。

一型錯誤,用 α 表示苞慢,全稱 Type-I error英妓;

二型錯誤,用 β 表示辑畦,全稱 type-II error腿倚;

有個比較經(jīng)典的圖表示 Type-I error 和 type-II error:

image

(圖片來源忘了敷燎,侵刪)

因此硬贯,Power越大,犯第二型錯誤的概率越小鸵赖,我們就更有把握認為結(jié)果是顯著的拄衰。

下面分別從網(wǎng)頁版代碼版講一下怎么計算power和樣本量肾砂,網(wǎng)頁版代碼版均可完成分析,任選其一包吝。

2 網(wǎng)頁版計算孟德爾隨機化power和樣本量

網(wǎng)頁版的見地址https://shiny.cnsgenomics.com/mRnd/

2.1 網(wǎng)頁版計算孟德爾隨機化power

計算power需要用到7個輸入?yún)?shù)诗越,分別為sample size, α, βyx, βOLS, R2xz, σ2(x), σ2(y)息堂。 見下圖:

image
image

第一個參數(shù)sample size床未,指的是研究的樣本量大小斋扰;在這里假定樣本量是1000啃洋;

第二個參數(shù)是 α宏娄,指的是一型錯誤(Type-I error),默認0.05粮宛;

第三個參數(shù)是βyx十饥,指的是暴露變量和結(jié)局變量之間 真實 的相關(guān)系數(shù)逗堵。如何理解 真實 呢,以大胸和不愛運動為例汁咏,在校正了性別和年齡等一系列可能會影響大胸和不愛運動的變量后得到的回歸系數(shù)作媚,稱為暴露變量(不愛運動)和結(jié)局變量(大胸)真實的相關(guān)系數(shù)纸泡;

第四個參數(shù)是βOLS,指的是暴露變量(不愛運動)和結(jié)局變量(大胸)之間 觀察到 的相關(guān)系數(shù)蚤假,跟βyx的區(qū)別在于磷仰,這里不校正協(xié)變量境蔼;

第五個參數(shù)是R2xz伺通,指的是工具變量(一般指SNP)對暴露變量(不愛運動)的解釋度罐监;

第六個參數(shù)是σ2(x)瞒爬,指的是暴露變量(不愛運動)的方差疮鲫;

第七個參數(shù)是σ2(y)弦叶,指的是結(jié)局變量(大胸)的方差伤哺;

有了這7個參數(shù)以后,我們就可以計算power了绢彤。 power結(jié)果如下所示:

image

2.2 網(wǎng)頁版計算孟德爾隨機化樣本量

這個步驟同計算power的步驟茫舶,唯一不同的是刹淌,這個步驟是通過給定power,計算該power下需要的樣本量有勾;

image

在這里疹启,我們給定的power是0.8,其他的參數(shù)同上面的步驟蔼卡,得到的樣本量如下所示:

image

3 代碼版計算孟德爾隨機化power和樣本量

該代碼出自網(wǎng)站https://github.com/kn3in/mRnd

3.1 代碼版計算孟德爾隨機化power

在Rscript中運行results函數(shù)(以下代碼完全照搬喊崖,不要修改任何參數(shù)):

results <- function(N, alpha, byx, bOLS, R2xz, varx, vary, epower) {
    
    threschi <- qchisq(1 - alpha, 1) # threshold chi(1) scale
    f.value <- 1 + N * R2xz / (1 - R2xz) #R2xz, Proportion of variance explained for the association between the SNP or allele score (Z) and the exposure variable (X)
    con <- (bOLS - byx) * varx # covariance due to YX confounding
    vey <- vary - byx * varx * (2 * bOLS - byx)
    
    if (vey < 0) {
    
        data.frame(Error = "Error: Invalid input. The provided parameters result in a negative estimate for variance of the error term in the two-stage least squares model.")
    
    } else {

        if (is.na(epower)) {
        
            b2sls <- byx + con / (N * R2xz)
            v2sls <- vey / (N * R2xz * varx)
            NCP <- b2sls^2 / v2sls
            # 2-sided test
            power <- 1 - pchisq(threschi, 1, NCP)
            data.frame(Parameter = c("Power", "NCP", "F-statistic"), Value = c(power, NCP, f.value), Description = c("", "Non-Centrality-Parameter", "The strength of the instrument"))    
        
        } else {
        
            # Calculation of sample size given power
            z1 <- qnorm(1 - alpha / 2)
            z2 <- qnorm(epower)
            Z  <- (z1 + z2)^2
            # Solve quadratic equation in N
            a <- (byx * R2xz)^2
            b <- R2xz * (2 * byx * con - Z * vey / varx)
            c <- con^2
            N1 <- ceiling((-b + sqrt(b^2 - 4 * a * c)) / (2 * a)) #ceiling返回對應(yīng)數(shù)字的'天花板'值,就是不小于該數(shù)字的最小整數(shù)
            data.frame(Parameter = "Sample Size", Value = N1)
        
        }
    }
}

隨后運行以下如下命令:

results(N=1000,alpha=0.05, byx=1.3, bOLS=1.41, R2xz=0.01, varx=1, vary=116.6, epower=NA)

各個參數(shù)代表的意義如下所示:

alpha=0.05 #Type-I error rate

N=1000 # Sample size

byx=1.3 #the regression coefficients for the association between exposure (X) and outcome (Y) variables (adjusted for confounders).

R2xz=0.01 # genetic instrument that explains R2xz=0.01 of variation in exposure (X)

bOLS=1.41 # the regression coefficients for the association between exposure (X) and outcome (Y) variables (no confounder-adjustment)

varx=1 # Variance of the exposure variable (X)

vary=116.6 #Variance of the outcome variable (Y)

得到的結(jié)果如下所示:

image

3.2 代碼版計算孟德爾隨機化樣本量

該步驟與前面一致荤懂,運行results函數(shù)后,再運行如下命令:

results(N=NA,alpha=0.05, byx=1.3, bOLS=1.41, R2xz=0.01, varx=1, vary=116.6, epower=0.8)

各個參數(shù)代表的意義如下所示:

alpha=0.05 #Type-I error rate

epower=0.8 # 1-(type-II error rate)

byx=1.3 #the regression coefficients for the association between exposure (X) and outcome (Y) variables (adjusted for confounders).

R2xz=0.01 # genetic instrument that explains R2xz=0.01 of variation in exposure (X)

bOLS=1.41 # the regression coefficients for the association between exposure (X) and outcome (Y) variables (no confounder-adjustment)

varx=1 # Variance of the exposure variable (X)

vary=116.6 #Variance of the outcome variable (Y)

得到的結(jié)果如下所示:

image

原文出處:Brion M J A, Shakhbazov K, Visscher P M. Calculating statistical power in Mendelian randomization studies[J]. International journal of epidemiology, 2013, 42(5): 1497-1501.


此推文感謝彭師姐推薦~


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末喝峦,一起剝皮案震驚了整個濱河市势誊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌谣蠢,老刑警劉巖粟耻,帶你破解...
    沈念sama閱讀 211,290評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件查近,死亡現(xiàn)場離奇詭異,居然都是意外死亡挤忙,警方通過查閱死者的電腦和手機霜威,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評論 2 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來册烈,“玉大人戈泼,你說我怎么就攤上這事∩蜕” “怎么了大猛?”我有些...
    開封第一講書人閱讀 156,872評論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長淀零。 經(jīng)常有香客問我挽绩,道長,這世上最難降的妖魔是什么驾中? 我笑而不...
    開封第一講書人閱讀 56,415評論 1 283
  • 正文 為了忘掉前任唉堪,我火速辦了婚禮,結(jié)果婚禮上肩民,老公的妹妹穿的比我還像新娘唠亚。我一直安慰自己,他們只是感情好持痰,可當我...
    茶點故事閱讀 65,453評論 6 385
  • 文/花漫 我一把揭開白布灶搜。 她就那樣靜靜地躺著,像睡著了一般共啃。 火紅的嫁衣襯著肌膚如雪占调。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,784評論 1 290
  • 那天移剪,我揣著相機與錄音究珊,去河邊找鬼。 笑死纵苛,一個胖子當著我的面吹牛剿涮,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播攻人,決...
    沈念sama閱讀 38,927評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼取试,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了怀吻?” 一聲冷哼從身側(cè)響起瞬浓,我...
    開封第一講書人閱讀 37,691評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎蓬坡,沒想到半個月后猿棉,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體磅叛,經(jīng)...
    沈念sama閱讀 44,137評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,472評論 2 326
  • 正文 我和宋清朗相戀三年萨赁,在試婚紗的時候發(fā)現(xiàn)自己被綠了弊琴。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,622評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡杖爽,死狀恐怖敲董,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情慰安,我是刑警寧澤腋寨,帶...
    沈念sama閱讀 34,289評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站化焕,受9級特大地震影響精置,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜锣杂,卻給世界環(huán)境...
    茶點故事閱讀 39,887評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望番宁。 院中可真熱鬧元莫,春花似錦、人聲如沸蝶押。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽棋电。三九已至茎截,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間赶盔,已是汗流浹背企锌。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留于未,地道東北人撕攒。 一個月前我還...
    沈念sama閱讀 46,316評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像烘浦,于是被迫代替她去往敵國和親抖坪。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,490評論 2 348