杜院士是博士畢業(yè)馬上要上院士在學(xué)校當(dāng)老師的醫(yī)生腻贰。
最近他老人家給我種草了統(tǒng)計(jì)學(xué)吁恍,三言兩語我被問的一愣一愣的,感覺自己以前學(xué)的統(tǒng)計(jì)學(xué)都被狗吃了播演。
我決定要弱弱地回?fù)粢幌录酵摺`牛劝饣厝前伞?/p>
好写烤,開始翼闽。
導(dǎo)語:醫(yī)學(xué)科技論文,特別是高質(zhì)量的原始論著及根據(jù)高質(zhì)量原始論著產(chǎn)生的系統(tǒng)評(píng)價(jià)已不斷地改進(jìn)和規(guī)范著臨床醫(yī)療實(shí)踐活動(dòng)顶霞。因此肄程,醫(yī)學(xué)文獻(xiàn)的質(zhì)量高低與我們的臨床醫(yī)療實(shí)踐活動(dòng)密切相關(guān)锣吼。然而,如果統(tǒng)計(jì)學(xué)方法應(yīng)用不當(dāng)蓝厌,不僅不能準(zhǔn)確地反映科研結(jié)果玄叠,而且還可能帶來錯(cuò)誤的結(jié)論。
1. 統(tǒng)計(jì)學(xué)方法的內(nèi)容
是統(tǒng)計(jì)學(xué)方法必須描述的3方面內(nèi)容。
2. 統(tǒng)計(jì)軟件包
SPSS (statistics package for social science) 和SAS(statistical analysis system ) 是全世界學(xué)術(shù)界公認(rèn)且最常用的兩大統(tǒng)計(jì)軟件包代态。
3. 檢驗(yàn)水準(zhǔn)
檢驗(yàn)水準(zhǔn)即——表示組間實(shí)際無差別而統(tǒng)計(jì)結(jié)果判斷為有差別寺惫,犯這類錯(cuò)誤的概率。實(shí)際工作中常取
蹦疑,表示本次研究計(jì)算所得
值必須小于0.05西雀,才能認(rèn)為組間差異有統(tǒng)計(jì)學(xué)意義。
因而對(duì)于檢驗(yàn)水準(zhǔn)的描述多簡(jiǎn)化為 "" 歉摧。
4. 統(tǒng)計(jì)分析方法
統(tǒng)計(jì)分析方法的準(zhǔn)確描述是科技論文科學(xué)性的關(guān)鍵所在艇肴。統(tǒng)計(jì)學(xué)方法一般包括和
(即:假設(shè)檢驗(yàn)) 兩部分內(nèi)容。
4.1 統(tǒng)計(jì)描述
統(tǒng)計(jì)描述主要是根據(jù)資料類型及原始數(shù)據(jù)分布類型叁温,選擇正確的指標(biāo)描述資料特征再悼。
4.1.1 資料類型
資料類型分為定量資料和定性資料。
定量資料是指對(duì)每個(gè)觀察對(duì)象測(cè)得的某個(gè)指標(biāo)能夠用具體數(shù)值表示膝但,如:年齡冲九、身高、每張切片的陽性細(xì)胞百分率等;
定性資料指對(duì)每個(gè)觀察對(duì)象測(cè)得的某個(gè)指標(biāo)不能用具體數(shù)值表示跟束,僅反映觀察對(duì)象的某一特征莺奸,如: 陽性、陰性泳炉,ABO 血型憾筏,治愈、顯效花鹅、好轉(zhuǎn)氧腰、無效等参萄。
4.1.2 資料的統(tǒng)計(jì)描述
(1)正態(tài)分布-定量資料-的統(tǒng)計(jì)描述
定量資料如果符合正態(tài)分布酣难,統(tǒng)計(jì)描述指標(biāo)可用均數(shù)及標(biāo)準(zhǔn)差,一般描述為“數(shù)據(jù)以均數(shù)±標(biāo)準(zhǔn)差表示”;
(2)非正態(tài)分布-定量資料-的統(tǒng)計(jì)描述
定量資料如果不符合正態(tài)分布钱骂,則統(tǒng)計(jì)描述指標(biāo)選用中位數(shù)和級(jí)差(即: 最大值和最小值之差)真友。
區(qū)分資料是正態(tài)或偏態(tài)分布黄痪,可以通過SPSS、SAS 統(tǒng)計(jì)軟件程序判斷盔然,也可以通過目測(cè)數(shù)據(jù)是否有"極端值"桅打,即特別大或特別小的數(shù)據(jù)是嗜,進(jìn)行判斷。
(3)定性資料-的統(tǒng)計(jì)描述
定性資料的統(tǒng)計(jì)描述包括率挺尾、構(gòu)成比及相對(duì)比鹅搪。
率表示單位時(shí)間內(nèi)某現(xiàn)象或事物發(fā)生的概率,如發(fā)病率遭铺、死亡率等丽柿;
構(gòu)成比指事物內(nèi)部某一部分的個(gè)體數(shù)與該事物各部分個(gè)體數(shù)的總和之比,表示各構(gòu)成部分在全體中所占的比重或分布甫题,不能說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度,如性別構(gòu)成芹扭、疾病構(gòu)成麻顶、死亡構(gòu)成等。然而舱卡,在實(shí)際應(yīng)用中以構(gòu)成比代替率很常見。
例如队萤,某文分析240 例耳鼻咽喉科住院患者轮锥,鼻竇炎41 例,稱發(fā)病率17. 08% 要尔,文中“發(fā)病率”實(shí)際為鼻竇炎患者在該科所有患者中的構(gòu)成比赵辕。此外既绩,還有將病死率誤用為死亡率、患病率誤用為發(fā)病率等还惠,這些都需引起作者的注意救欧。某種疾病發(fā)病率= 某段時(shí)間內(nèi)發(fā)生該疾病的人數(shù)/某段時(shí)間內(nèi)可能發(fā)生該種疾病的總?cè)藬?shù)某種疾病構(gòu)成比= 某段時(shí)間內(nèi)發(fā)生該疾病的人數(shù)/某段時(shí)間內(nèi)發(fā)生各種疾病的總?cè)藬?shù)。
4.2 假設(shè)檢驗(yàn)
科技論文中最常用的是組間差異性檢驗(yàn)锣光。假設(shè)檢驗(yàn)方法很多笆怠,不同的科研設(shè)計(jì)類型及資料類型適用的檢驗(yàn)方法有所不同。定量資料與定性資料常用的統(tǒng)計(jì)分析方法介紹如下誊爹。
4.2.1 定量資料
定量資料的統(tǒng)計(jì)分析方法包括參數(shù)法和非參數(shù)法.
參數(shù)法——t檢驗(yàn)蹬刷、方差分析瓢捉;非參數(shù)法——秩和檢驗(yàn)。
選擇的關(guān)鍵在于資料分布類型办成,如果資料符合正態(tài)分布且組間方差齊(即各組標(biāo)準(zhǔn)差彼此接近) 則選用參數(shù)法泡态,不符合則選用非參數(shù)法。
但在許多醫(yī)學(xué)論文中經(jīng)常忽略這兩個(gè)條件诈火,不考慮資料的分布直接采用t 檢驗(yàn)或方差分析兽赁,由此得出的分析結(jié)果是不可信的,見例1冷守。
例1:
為研究刀崖、
腫瘤標(biāo)志在喉癌患者手術(shù)前、后有無差異拍摇,分別檢測(cè)了58 名患者前及術(shù)后
和
亮钦,經(jīng)配對(duì)
檢驗(yàn),
術(shù)前充活、后差異有統(tǒng)計(jì)學(xué)意義蜂莉,結(jié)果見表1。
表1. 腫瘤標(biāo)記物術(shù)前術(shù)后的檢測(cè)*
組別 | TGF- β(μg/l) | CEA(μg/l) |
---|---|---|
術(shù)前 | 19.0±26.3 | 34.0±79.0 |
術(shù)后 | 4.8±7.5* | 20.6±11.2 |
與術(shù)前比較p值﹤0.05
表中兩指標(biāo)標(biāo)準(zhǔn)差均相差達(dá)2 倍以上混卵,提示方差不齊映穗,故不宜采用t 檢驗(yàn),而適合采用秩和檢驗(yàn)幕随。
用于兩組均數(shù)間的比較蚁滋,包括兩獨(dú)立樣本
檢驗(yàn)、配對(duì)
檢驗(yàn)和樣本均數(shù)與總體均數(shù)比較的
檢驗(yàn)赘淮;
用于兩組或兩組以上均數(shù)的比較辕录。然而,在許多醫(yī)學(xué)論文中,對(duì)于3 組或3 組以上均數(shù)的兩兩比較梢卸,常重復(fù)使用獨(dú)立樣本t 檢驗(yàn)作比較走诞,如例2。這樣會(huì)加大犯陽性錯(cuò)誤的概率蛤高,即可能將無差別的兩個(gè)總體均數(shù)判斷為有差別蚣旱。這點(diǎn)尤其需引起作者的注意,這也是醫(yī)學(xué)科技論文中
濫用的重要表現(xiàn)之一襟齿。
此類資料正確的分析方法應(yīng)是先進(jìn)行方差分析姻锁,以確定這幾組均數(shù)總體差異有無統(tǒng)計(jì)學(xué)意義;如果有統(tǒng)計(jì)學(xué)意義猜欺,則進(jìn)一步采用(任意組間兩兩比較) 或
(每個(gè)實(shí)驗(yàn)組與對(duì)照組比較) 以確定哪些組間差異有統(tǒng)計(jì)學(xué)意義位隶。
例2:
為了解不同分化程度的下咽癌患者 表達(dá)陽性脈管的數(shù)目
表達(dá)陽性脈管差異,分別檢測(cè)16 例高分化患者开皿,15 例中分化者及13 例低分化者涧黄,作者采用獨(dú)立樣本
篮昧,結(jié)果見表2。
表2 下咽癌組織中VEGFR- 3 表達(dá)陽性脈管與病理分級(jí)的關(guān)系
組別 | 例數(shù) | VEGFR- 3 表達(dá)陽性脈管 |
---|---|---|
高分化組 | 16 | 14.29±6.50 |
中分化組 | 15 | 15.65±5.84 |
低分化組 | 13 | 16.16±4.75 |
各組之間p 值﹥0.05
4.2.2 定性資料
定性資料整理與歸納后笋妥,主要分為3種類型懊昨,即四格表資料(只有2組,且結(jié)果變量為2分類變量春宣,總絡(luò)子數(shù)為4見表3)酵颁、行×列表資料(總格子數(shù)>4,見表4) 和列聯(lián)表資料(又稱雙向有序資料月帝,見表5)躏惋。
行×列表資料又包括單向有序資料(即等級(jí)資料,2組或2組以上嚷辅,結(jié)果變量為有序多分類變量簿姨,見表6)。不同資料類型采用的統(tǒng)計(jì)分析方法有所不同簸搞。
表3 四格表資料格式
組別 | 陰性 | 陽性 | 合計(jì) |
---|---|---|---|
實(shí)驗(yàn)組 | 10 | 29 | 39 |
對(duì)照組 | 24 | 11 | 35 |
合計(jì) | 34 | 40 | 74 |
表4 行×列表資料格式
組別 | 陰性 | 陽性 | 合計(jì) |
---|---|---|---|
實(shí)驗(yàn)1組 | 10 | 29 | 39 |
實(shí)驗(yàn)2組 | 15 | 19 | 34 |
對(duì)照組 | 24 | 11 | 35 |
合計(jì) | 49 | 59 | 108 |
表5 列聯(lián)表資料格式
N 分期 | |||||
---|---|---|---|---|---|
T 分期 | N0 | N1 | N2 | N3 | 合計(jì) |
:-: | :-: | :-: | :-: | :-: | :-: |
T1 | 15 | 9 | 4 | 3 | 31 |
T2 | 13 | 14 | 9 | 4 | 40 |
T3 | 9 | 14 | 6 | 5 | 34 |
T4 | 8 | 7 | 7 | 4 | 26 |
合計(jì) | 45 | 44 | 26 | 16 | 131 |
表6 單向有序資料格式
組別 | 無效 | 好轉(zhuǎn) | 顯效 | 治愈 | 合計(jì) |
---|---|---|---|---|---|
實(shí)驗(yàn)組 | 3 | 9 | 11 | 19 | 42 |
對(duì)照組 | 9 | 5 | 7 | 9 | 30 |
合計(jì) | 12 | 14 | 18 | 28 | 72 |
四格表資料χ2 檢驗(yàn)醫(yī)學(xué)論文中扁位,四格表資料χ2 檢驗(yàn)的應(yīng)用很常見,但使用時(shí)應(yīng)注意具體的應(yīng)用條件趁俊。當(dāng)總例數(shù)大于40域仇,且每個(gè)格子的理論頻數(shù)均不小于5 時(shí),應(yīng)用未校正的χ2 檢驗(yàn);如果總例數(shù)大于40,有一個(gè)格子的理論頻數(shù)小于5 但大于1寺擂,采用校正的χ2 檢驗(yàn); 如果總例數(shù)小于40殉簸,或有一個(gè)格子的理論頻數(shù)小于1,則采用Fisher 確切概率法沽讹。實(shí)際應(yīng)用中,許多作者不考慮應(yīng)用的前題條件武鲁,均使用未校正的χ2 檢驗(yàn)爽雄,從而導(dǎo)致結(jié)果不可靠。行×列表資料χ2 檢驗(yàn)行×列表資料χ2 檢驗(yàn)主要用于多個(gè)率或構(gòu)成比的比較沐鼠。但此時(shí)要求所有格子中理論頻數(shù)小于5 的格子數(shù)少于總格子數(shù)的1/5挚瘟。如果大于1/5 ,則相鄰格子應(yīng)刪除或合并后再計(jì)算饲梭。此時(shí)若需了解具體那些率之間差異有統(tǒng)計(jì)學(xué)意義乘盖,就需進(jìn)行χ2 分割來確定。
單向有序資料此類資料如果是比較組間治療效果差異有無統(tǒng)計(jì)學(xué)意義憔涉,則應(yīng)采用秩和檢驗(yàn)订框。如果采用χ2 檢驗(yàn),僅表明各組的療效構(gòu)成差異有無統(tǒng)計(jì)學(xué)意義兜叨,因?yàn)榇藭r(shí)只利用了每組構(gòu)成比提供的信息穿扳,損失了有序指標(biāo)提供的“等級(jí)”信息衩侥。這也是許多作者誤用統(tǒng)計(jì)學(xué)方法的資料類型之一,需尤其注意矛物。列聯(lián)表資料χ2 檢驗(yàn)此類資料特征為對(duì)同一組觀察對(duì)象茫死,分別觀察其兩種有序分類變量的表現(xiàn),歸納成雙向交叉排列的統(tǒng)計(jì)表履羞,分析兩個(gè)分類變量是否有相關(guān)聯(lián)系的假設(shè)檢驗(yàn)峦萎,采用行×列表χ2 檢驗(yàn)。
4.2.3 相關(guān)性分析
如果需了解兩變量有無相關(guān)性忆首,或相關(guān)程度有多大爱榔,此時(shí)需作相關(guān)分析。相關(guān)分析應(yīng)報(bào)告相關(guān)系數(shù)及對(duì)該相關(guān)系數(shù)所作的假設(shè)檢驗(yàn)P 值雄卷。相關(guān)系數(shù)種類很多搓蚪,選擇時(shí)應(yīng)根據(jù)指標(biāo)類型來確定。如果是計(jì)量指標(biāo),則應(yīng)選擇Pearson 相關(guān)系數(shù); 如果是等級(jí)指標(biāo)丁鹉,則應(yīng)選擇Spearman 相關(guān)系數(shù)妒潭。
4.2.4 結(jié)論的表述
首先要明確“P 值< 0.05”,習(xí)慣上稱“顯著”(significant) 揣钦,僅說明兩組差異有統(tǒng)計(jì)學(xué)意義雳灾,并不能說明兩組該指標(biāo)相差很大,或在專業(yè)上有顯著的(重要的)價(jià)值; 反之冯凹,P 值>0.05谎亩,習(xí)慣上稱“不顯著”(non significant) ,不應(yīng)誤解為相差不大宇姚,或一定相等匈庭,僅說明從統(tǒng)計(jì)角度考慮這兩組差異無統(tǒng)計(jì)學(xué)意義。為了不與一般意義上的“顯著”浑劳、“不顯著”相混淆阱持,許多統(tǒng)計(jì)學(xué)家主張作結(jié)論時(shí)不用“是否顯著”一詞,而用“差異有無統(tǒng)計(jì)學(xué)意義”魔熏。
此外衷咽,根據(jù)統(tǒng)計(jì)結(jié)果得出專業(yè)結(jié)論不能太絕對(duì)化,因?yàn)榻y(tǒng)計(jì)結(jié)論均是概率性的蒜绽,不是絕對(duì)的肯定或否定镶骗,本次研究統(tǒng)計(jì)結(jié)果是陰性,如果增加樣本含量躲雅,組間差異可能就有統(tǒng)計(jì)學(xué)意義了鼎姊。
綜上所述,不同的統(tǒng)計(jì)分析方法均有其應(yīng)用條件和適用范圍,實(shí)際應(yīng)用時(shí)此蜈,必須根據(jù)科研設(shè)計(jì)類型及變量類型選擇恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法即横,同時(shí)注意檢查結(jié)果解釋和專業(yè)結(jié)論是否同時(shí)滿足專業(yè)和統(tǒng)計(jì)學(xué)要求。切忌將t 檢驗(yàn)裆赵、χ2 檢驗(yàn)視為分析資料的“萬能工具”东囚,盲目套用,導(dǎo)致文章的科學(xué)性降低战授。