轉(zhuǎn)載丁香園 作者:clongxue??原文出處(軟件見原文出處)
作為一名臨床醫(yī)師向胡,或是醫(yī)學(xué)生,不管你愿意不愿意,都必須寫論文袱蚓。醫(yī)學(xué)論文有別于其他論文遍尺,我們那些“神圣”的數(shù)據(jù)都必須進(jìn)行統(tǒng)計學(xué)處理,這時橱野,大多數(shù)人會遇到一個難題灶搜,大學(xué)時期學(xué)過的《醫(yī)學(xué)統(tǒng)計學(xué)》早就忘得差不多了,重新翻開統(tǒng)計學(xué)書本瞎疼,基本上也是看得云里霧里科乎。為了不讓同學(xué)們再次重溫早年學(xué)習(xí)統(tǒng)計學(xué)時的那種痛苦的體驗,我不自量力贼急,特編寫《醫(yī)學(xué)統(tǒng)計學(xué)傻瓜教程》茅茂,本教程有別于其他任何的統(tǒng)計學(xué)教程,其特點是略去一些高深難懂的統(tǒng)計學(xué)原理及計算公式太抓,直奔解決實際問題的方法空闲,小學(xué)小用,大學(xué)大用走敌,另有妙用碴倾。
你不需要任何的統(tǒng)計學(xué)基礎(chǔ),為了不引起你的反感掉丽,不會出現(xiàn)任何一道數(shù)學(xué)公式跌榔。本教程分“基礎(chǔ)篇”及“提高篇”兩個部分,學(xué)完“基礎(chǔ)篇”即可解決絕大多數(shù)的統(tǒng)計學(xué)問題捶障,學(xué)完“提高篇”僧须,“降龍十八掌”的武功已修練到“第10層”,足以讓你的同事對你刮目相看残邀。
整個學(xué)習(xí)時間約需要2~3小時皆辽,在學(xué)習(xí)之前,我們需要到網(wǎng)上下載一個小工具芥挣,即《臨床醫(yī)師統(tǒng)計學(xué)助手 V10.0》)(見本文未尾的附件)驱闷,因為進(jìn)行統(tǒng)計學(xué)處理時最令人頭痛的問題是煩瑣的計算,則全部由預(yù)存在本軟件內(nèi)的計算公式來完成空免。
這是一個全“傻瓜化”的教程空另,“基礎(chǔ)篇”及“提高篇”各由數(shù)個實例組成,只要認(rèn)真看完這些實例蹋砚,將實際中碰到的問題對號入座即可扼菠,接下來我們開始輕松愉快的學(xué)習(xí)過程。
一坝咐、基礎(chǔ)篇
1循榆、均數(shù)與標(biāo)準(zhǔn)差
【例1】本組105 例, 男55例墨坚, 女50例秧饮; 平均年齡:62.3±6.1歲,所有入選病例均符合1999年WHO高血壓診斷標(biāo)準(zhǔn)。
舉這個例子是為了說明“均數(shù)”與“標(biāo)準(zhǔn)差”的概念盗尸。我實在不愿意多花時間闡述一些概念性的東西柑船,但是由于“標(biāo)準(zhǔn)差”的概念實在太重要了∑酶鳎【例1】中的數(shù)據(jù)“62.3±6.1”鞍时,“62.3”就是年齡的均數(shù),均數(shù)的概念大家都懂扣蜻,那么后面的“6.1”是什么呢逆巍?它就是標(biāo)準(zhǔn)差。有人可能會問弱贼,表達(dá)一組人的平均年齡蒸苇,用均數(shù)就夠了,為什么還要加一個標(biāo)準(zhǔn)差呢吮旅?先看下面的一個例子:有兩組人溪烤,第1組身高(cm):98、99庇勃、100檬嘀、101、102责嚷;第2組身高(cm):80鸳兽、90、100罕拂、110揍异、120,這兩組人雖然身高的均數(shù)都是100cm爆班,但是衷掷,仔細(xì)觀察,第1組的身高很接近柿菩,第2組的身高差別很大戚嗅,故僅僅用一個平均數(shù)表達(dá)一組數(shù)據(jù)的特征是不完整的,還需要用另一個指標(biāo)來表達(dá)其參差不齊的程度枢舶,這就是標(biāo)準(zhǔn)差懦胞。統(tǒng)計學(xué)上對一組測量結(jié)果的數(shù)據(jù)都要用“均數(shù)±標(biāo)準(zhǔn)差”表示,習(xí)慣表達(dá)代號是:±s凉泄,具體例子如:平均收縮壓120±10.2mmHg躏尉。
我想現(xiàn)在同學(xué)們都已知道標(biāo)準(zhǔn)差是什么東東了,那么后众,標(biāo)準(zhǔn)差是怎樣得到的呢醇份?有一個比較復(fù)雜的計算公式稼锅,我們不必去深究這個公式是怎么樣的,只需知道標(biāo)準(zhǔn)差越小僚纷,說明數(shù)據(jù)越集中,標(biāo)準(zhǔn)差越大拗盒,說明數(shù)據(jù)越分散怖竭。撰寫醫(yī)學(xué)論文的第一步是收集原始數(shù)據(jù),如:
??? 第1組身高(cm):98陡蝇、99痊臭、100、101登夫、102广匙;
??? 第2組身高(cm):80、90恼策、100鸦致、110、120涣楷。
在論文中并不是直接給出原始數(shù)據(jù)分唾,而是要以±s方式表示。利用軟件《臨床醫(yī)師統(tǒng)計學(xué)助手 V10.0》狮斗,只要輸入原始數(shù)據(jù)绽乔,就能自動計算出均數(shù)及標(biāo)準(zhǔn)差,即第1組平均身高:100±1.58cm碳褒;第2組平均身高:100±15.81cm折砸,如下圖。
2沙峻、兩樣本均數(shù)t檢驗
【例2】目的 研究中藥板蘭根對“非典”療效睦授。方法 將36例“非典”患者隨機分為治療組19例,采用常規(guī)治療+板蘭根口服专酗,對照組17例睹逃,僅采用常規(guī)治療。結(jié)果? 治療組平均退熱時間3.28±1.51d祷肯;對照組平均退熱時間5.65±1.96d沉填,兩組間對照差別有極顯著意義(p<0.01)結(jié)論? 中藥板蘭根對“非典”有顯效療效,實為國之瑰寶佑笋。
這是最常見的一種統(tǒng)計學(xué)數(shù)據(jù)處理類型翼闹,統(tǒng)計學(xué)述語叫做“兩樣本均數(shù)差別t檢驗”,說得通俗易懂一些蒋纬,就是檢驗兩組方法所得到的數(shù)據(jù)到底有沒有差異猎荠,或者說坚弱,差異是否有意義。我們平時的思維習(xí)慣是关摇,數(shù)據(jù)的大小還用得著檢驗嗎荒叶?這是小學(xué)生都會的問題,但是統(tǒng)計學(xué)可不是這樣簡單的看問題输虱。
可能還沒有說明白這個問題些楣,下面舉一個簡單的例子。我們的目的是得出這樣一個結(jié)論:“北京出產(chǎn)的西瓜比上海出產(chǎn)的西瓜大”宪睹。最可靠的方法是把全部的北京產(chǎn)西瓜和全部的上海產(chǎn)西瓜都稱重量愁茁,得到兩個均數(shù),然后比大小即可亭病,可是智商正常的人并不會這樣去做鹅很,通常的做法是,隨機選一部分北京的西瓜和一部分上海的西瓜罪帖,先讓這兩部分西瓜比大小促煮,然后推斷到底那里的西瓜大。這種方法是“窺一斑可見全豹”胸蛛,統(tǒng)計學(xué)述語叫做“由樣本推斷總體”污茵,事實上,我們所做的醫(yī)學(xué)科研都是基于這種方法葬项。
再回到上面的例子泞当,假如我們有二種做法:
A、隨機選2個北京西瓜民珍,平均重量是5.6±0.3kg襟士;再隨機選2個上海西瓜,平均重量是4.3±0.25kg嚷量;
B陋桂、隨機選1000個北京西瓜,平均重量是5.6±0.3kg蝶溶;再隨機選1000個上海西瓜嗜历,平均重量是4.3±0.25kg。
憑我們的直覺和生活常識抖所,由B推出“北京的西瓜比上海西瓜大”這個結(jié)論的把握性就非常的大梨州,而A則基本上推不出這個結(jié)論。為什么這樣說呢田轧?北京全部的西瓜叫“總體”暴匠,隨機選擇的2個西瓜叫“樣本”,通常我們不會拿“總體”去比大小傻粘,這太困難了每窖,而總是拿“樣本”去比大小帮掉,這樣就可能會有一個問題,你所抽到的樣本窒典,可能都是最大的西瓜蟆炊,也可能都是最小的西瓜,這樣由樣本來推斷總體就可能會出現(xiàn)錯誤(抽樣誤差)瀑志,如何來解決這個問題呢盅称,這就是統(tǒng)計學(xué)所研究的問題,總體來說后室,樣本量越小,抽樣誤差越大混狠,由樣本推斷總體的把握性越低岸霹,從上面例子中,相對B而言将饺,A的可靠性就很低」北埽現(xiàn)在,終于可以引出我們的主題了予弧,統(tǒng)計學(xué)處理本質(zhì)是研究由樣本差異推斷總體差異的把握性有多大刮吧,這種把握性在統(tǒng)計學(xué)上用p值表示。如p<0.05或P<0.01掖蛤,可以理解為由樣本差異推斷總體差異的把握性達(dá)95%或99%以上杀捻;如P>0.05,可以理解為這種把握性在95%以下蚓庭。
上面所講的實已為統(tǒng)計學(xué)之精髓致讥,也是本教程最艱難的部分,建議多看幾遍器赞。如果天生愚魯垢袱,還是不明白,也沒有關(guān)系港柜,我們可以簡單的理解為所謂統(tǒng)計學(xué)處理请契,實際上是為了弄明白兩組數(shù)據(jù)的差異由抽樣誤差造成的可能性有多少?這種抽樣誤差的可能性由p值來表示夏醉,p<0.05或p<0.01爽锥,說明抽樣誤差的可能性很小(低于5%或1%)授舟,兩組數(shù)據(jù)差異有顯著意義救恨;p>0.05,說明抽樣誤差的可能性很大(高于5%)释树,兩組數(shù)據(jù)差異沒有顯著意義肠槽。
所以擎淤,統(tǒng)計學(xué)處理的中心任務(wù)是求p值。那么如何求p值呢秸仙?這里本來需要例舉出一大堆的數(shù)學(xué)計算公式嘴拢,但是現(xiàn)在不這樣做,我們由軟件來直接計算寂纪。結(jié)合【例2】席吴,具體操作如下。
【例2】中一共有6個數(shù)據(jù):第一組均數(shù)(X1)捞蛋、標(biāo)準(zhǔn)差(S1)孝冒、例數(shù)(N1)與第二組均數(shù)(X2)、標(biāo)準(zhǔn)差(S2)拟杉、例數(shù)(N2)庄涡,把這6個數(shù)據(jù)輸入軟件對應(yīng)的框內(nèi),該軟件就會利用預(yù)先存儲的公式自動計算t值搬设,并得出p<0.01,由此判斷兩組間的差別具有極顯著的意義(如果沒有想成為統(tǒng)計學(xué)專家穴店,就不必去理解“t值”是什么了,知道“t值”是為了求“p值”用的就可以了)拿穴,如下圖泣洞。
3、配對計量資料t檢驗
【例3】目的 研究音樂胎教對胎兒運動技能培養(yǎng)的效果默色。方法 10例28~32周孕婦球凰,分別記錄聽音樂(水滸傳電視劇主題曲)前每小時的胎動次數(shù)及聽音樂后每小時的胎動次數(shù),結(jié)果 數(shù)據(jù)如下表所示该窗,音樂胎教后胎動次數(shù)增多弟蚀,差別有顯著意義(p<0.0525)結(jié)論 音樂胎教可增強胎兒運動技能,對培養(yǎng)我國運動天才有現(xiàn)實意義酗失。
顯然【例3】與【例2】有所不同义钉,主要是【例3】兩組間的數(shù)據(jù)可以前后配對的。我們經(jīng)常碰到這種情況规肴,即同一個體做兩次處理捶闸,如治療前檢測某一指標(biāo),治療后再檢測某一指標(biāo)拖刃,而后做治療前后配對比較删壮,以判斷療效。這種情況如何進(jìn)行統(tǒng)計學(xué)處理呢兑牡?在軟件中選擇“配對資料t檢驗”央碟,分別輸入上面的2組數(shù)據(jù),軟件自動計算p<0.05,差別有顯著意義均函,如下圖亿虽。
可能同學(xué)們會問,【例3】的情況菱涤,也可以把胎教前視為對照組,求得平均胎動次數(shù)是:21.8±5.31洛勉,胎教后視為治療組粘秆,求得平均胎動次數(shù)是:24.0±6.31,然后套用【例2】的方法收毫,用“兩樣本均數(shù)t檢驗”行不行攻走?這樣雖無大錯誤,但是將會導(dǎo)致檢驗效率的下降此再,就是說昔搂,如果數(shù)據(jù)差異較大時,兩種方法均可输拇,如果數(shù)據(jù)差異較小時巩趁,用“配對t檢驗”會顯示出差異有意義,而用“兩樣本均數(shù)t檢驗”時淳附,可能差異無意義。切記蠢古,非配對資料誤用配對t檢驗奴曙,則是錯誤的。
4草讶、計數(shù)資料卡方檢驗
【例4】目的 研究醫(yī)患關(guān)系對重癥病人死亡率的影響洽糟。方法 根據(jù)問卷調(diào)查對收住重癥監(jiān)護病房的病人分為“醫(yī)患關(guān)系良好組”與“醫(yī)患關(guān)系緊張組”,比較兩組間的住院死亡率堕战。 結(jié)果 “醫(yī)患關(guān)系良好組”25例坤溃,住院間死亡3例,死亡率13.6%嘱丢,“醫(yī)患關(guān)系緊張組”23例薪介,住院間死亡9例,死亡率39.1%越驻,兩組間差別有顯著意義(p<0.05)結(jié)論 醫(yī)患關(guān)系緊張增加重癥病人的住院死亡率汁政,可能與醫(yī)師害怕挨打而治療方案趨向保守有關(guān)。
這又是一個非常常見的一種統(tǒng)計學(xué)數(shù)據(jù)處理類型缀旁〖桥【例4】中所提供的數(shù)據(jù)是“比例”,或百分?jǐn)?shù)并巍,與前面三個例子不同目木,前面三個例子所提供的數(shù)據(jù)則是直接在病人身上測量到的數(shù)據(jù),如收縮壓120±10.2mmHg懊渡、身高100±15.81cm等刽射,我們把【例4】中的數(shù)據(jù)叫做計數(shù)資料军拟,而【例1、2柄冲、3】中的數(shù)據(jù)叫做計量資料吻谋。計數(shù)資料無法用“均數(shù)±標(biāo)準(zhǔn)差”形式表示,只能用比例表示现横,如:死亡率13.6%漓拾、30例中顯效10例(10/30)等。
顯然戒祠,對于計數(shù)資料骇两,再用t檢是不適合了,必須用卡方檢驗姜盈〉颓В卡方檢驗的步驟是:先求出X2值(類似于t檢驗時先求t值),然后進(jìn)行判斷:
?⑴ 如果X2<3.84馏颂,則p>0.05示血;
⑵ 如果X2>3.84,則p<0.05救拉;
⑶ 如果X2>6.63难审,則p<0.01。
解釋一下亿絮,上面的兩個數(shù)字“3.84”與“6.63”是查“X2界值表”得來的告喊,只要記住即可。所以派昧,卡方檢驗的關(guān)鍵是求出X2值黔姜。為了求出X2值,必須先介紹“四表格”概念蒂萎「殉常“四表格”的形式如下,關(guān)鍵數(shù)據(jù)是 a五慈、b帮毁、c、d 四個數(shù)豺撑,X2值就是通過這四個數(shù)據(jù)計算出來的(這里仍不介紹公式烈疚,由軟件計算。)聪轿。
現(xiàn)將【例4】中的數(shù)據(jù)填入“四表格”即如下圖爷肝。
當(dāng)你學(xué)會了填“四表格”數(shù)據(jù)之后,就能利用軟件非常容易的進(jìn)行卡方檢驗了,本軟件提供與“四表格”完全相同的界面灯抛,選擇“計數(shù)資料卡方檢驗”金赦,把數(shù)據(jù)填寫正確之后,就自動計算X2值并判斷結(jié)果对嚼,【例4】X2=4.702>3.84夹抗,故p<0.05,如下圖纵竖。
在此說明一下漠烧,大家可能已注意到本軟件中出現(xiàn)的“理論數(shù)(T)”,在此不解釋“理論數(shù)(T)”是什么靡砌,只要記住已脓,當(dāng)例數(shù)(n)<40或T<1時,應(yīng)采用“精確概率法”通殃,這個方法太復(fù)雜度液,在此不作介紹。
5画舌、配對資料卡方檢驗
【例5】目的 研究螞蟻對慢性乙型病毒性肝炎的療效堕担。方法 40例慢性乙型病毒性肝炎患者每天口服活螞蟻10只,半年后檢查e抗原曲聂。結(jié)果 治療前e抗原陽性率67.5%照宝,治療后e抗原陽性率下降為12.5%,X2=15.75(p<0.01)結(jié)論 活螞蟻對慢性乙型病毒性肝炎有顯著療效句葵。
與【例3】相似,這也是一個治療前后對照的實例兢仰,所不同的是【例3】是計量資料乍丈,【例5】是計數(shù)資料,這時把将,該采用“配對資料卡方檢驗”轻专。
首無,我們把本例的原始資料整理如下:
然后察蹲,在軟件中選擇“配對資料卡方檢驗”请垛,把上面的數(shù)據(jù)分別填入表格中(請注意與原始數(shù)據(jù)的對應(yīng)關(guān)系), X2=15.75洽议,p<0.01宗收,如下圖。
二亚兄、提高篇
6混稽、方差分析(F檢驗)
【例6】某院外科對三種消毒劑的殺菌效果進(jìn)行考察。經(jīng)過使用,以被消毒物品的殘余細(xì)菌數(shù)(cfu/m2)為評價指標(biāo)匈勋,試驗結(jié)果如下表礼旅,試問三種消毒劑的效果是否存在差異?
現(xiàn)在洽洁,我們來分析這個例子痘系,與【例2】一樣,本例也是計量資料饿自,所不同的是汰翠,【例2】是兩組,本例是三組璃俗。是不是本例也可以用“兩樣本均數(shù)t檢驗”方法奴璃,分別進(jìn)行兩兩比較呢?答案是不行的城豁,將會導(dǎo)致檢驗效率的下降苟穆,這時正確的統(tǒng)計學(xué)方法是方差分析(F檢驗)。有必要重復(fù)一次唱星,兩組計量資料的比較應(yīng)用“t檢驗”雳旅,多組計量資料的比較應(yīng)用“F檢驗”,下面介紹方差分析的方法间聊。
?(1)選擇“方差分析(F檢驗)”攒盈,分別輸入三組的原始數(shù)據(jù),軟件會自動計算每組的均數(shù)±標(biāo)準(zhǔn)差哎榴,如果已知每組的均數(shù)±標(biāo)準(zhǔn)差型豁,可在對應(yīng)的表格內(nèi)直接輸入,不必再輸入原始資料尚蝌。
(2)軟件會自動計算F值(注意不是t值)及p值迎变,p<0.05或p<0.01表示三組間不全相同,即至少有兩組是不同的飘言,而不是全不相同衣形。
(3)當(dāng)知道三組消毒劑的效果不一樣后(p<0.05),我們?nèi)匀粺o法知道是不是三種消毒劑每一種效果都不一樣姿鸿,也不知道三種消毒劑哪一種效果最好谆吴,哪一種效果最差,如果想回答這些問題苛预,需要進(jìn)行兩兩比較句狼。本軟件提供2種兩兩比較的方法,即“兩兩比較q檢驗”及“兩兩比較LSD-t檢驗”热某,結(jié)果基本上是一致的鲜锚。
7突诬、多樣本率卡方檢驗
【例7】某院研究不同藥物對焦慮患者的療效,患者隨機分為三組芜繁,分別為阿米替林組旺隙、帕羅西丁組、安慰劑組骏令,問三組間療效是否存在差異蔬捷?
四表格卡方檢驗是最簡單的形式的卡方檢驗,當(dāng)遇到多組卡方檢驗時榔袋,需要采用行×列表卡方檢驗周拐,如下圖。
幾點說明:
1凰兑、行×列表卡方檢驗具有廣泛的適用性妥粟,但要求每個格子的理論數(shù)足夠大,如果發(fā)現(xiàn)某個格子中的理論數(shù)太小吏够,應(yīng)擴大觀察例數(shù)勾给。
2、于等級資料锅知,如臨床療效分為治愈播急、顯效、好轉(zhuǎn)售睹、無效桩警,臨床檢驗結(jié)果分為 +、++昌妹、+++ 等捶枢,帶有明顯的半定量性質(zhì),對于等級資料行×列表卡方檢驗缺乏敏感性飞崖,應(yīng)采用秩和檢驗或Ridit分析(下述)烂叔。
3、行×列表卡方檢驗結(jié)果p<0.05或p<0.01表示各組間不全相同蚜厉,而不是全不相同。
8畜眨、用秩和檢驗及Ridit分析
【例8】某院研究不同藥物對支氣管哮喘的患者的療效昼牛,患者隨機分為二組,分別為激素組康聂、中藥組贰健,問兩組間療效是否存在差異?
本例為等級資料恬汁,應(yīng)采用秩和檢驗或Ridit分析伶椿,如下圖(70%的醫(yī)學(xué)雜志對等資料誤用卡方檢驗!)。
秩和檢驗與Ridit分析可任選一種方法脊另,首先都是求出“Z值”导狡,然后得到“p值”,本例p<0.01偎痛,結(jié)論:激素組與中藥組兩組間療效差異有顯著意義旱捧。
9、直線相關(guān)與回歸
【例9】測量不同年齡的兒童身高數(shù)據(jù)如下踩麦,問兒童年齡與身高是否存在關(guān)聯(lián)?
在科研與臨床工作中枚赡,許多問題是存在關(guān)聯(lián)的,如體表面積與身高谓谦、體重之間有明顯的關(guān)聯(lián)贫橙,直線的相關(guān)與回歸即是研究兩個變量之間的關(guān)聯(lián)問題。兩個變量的關(guān)聯(lián)性分析反粥,可以分解為兩個問題卢肃,一是這兩個變量是否存在相互關(guān)聯(lián),即相關(guān)問題星压;二是如果兩個變量是有關(guān)聯(lián)的践剂,那么是什么樣的數(shù)量關(guān)系,即回歸問題娜膘,通常以回歸方程來表示⊙犯現(xiàn)在回到【例9】,研究兒童年齡與身高之間是否存在關(guān)聯(lián)呢竣贪?在軟件中選擇“直線相關(guān)與回歸”军洼,然后輸入以上的數(shù)據(jù),如下圖演怎。
計算結(jié)果p<0.05匕争,結(jié)論是兒童年齡與身高之間存在顯著的關(guān)聯(lián),并得出回歸方程 y=44.5278+10.9822x(y表示身高爷耀,x表示年齡)甘桑。
三、結(jié)語
現(xiàn)在已經(jīng)講完了9個實例歹叮,終于松了一口氣跑杭。掌握統(tǒng)計學(xué)的訣竅是將實際中碰到的的情況,對照本教程中實例咆耿,“對號入座”即可德谅,而具體計算過程,可由軟件去完成萨螺。最后再啰嗦幾句:1窄做、兩組計量資料用t檢驗愧驱;2、多組計量資料用方差分析(F檢驗)椭盏;3组砚、計數(shù)資料用卡方檢驗; 4庸汗、等級資料用用秩和檢驗或Ridit分析惫确。