文章-宮頸長度與雙胎自發(fā)性早產的相關性研究
文章中的統(tǒng)計學方法描述如下:
計量資料采用 (珚x ± s) 進行統(tǒng)計描述 暮蹂, 定性資料采用頻數(shù)和構成比描述 柒傻, 采用 t 檢驗或單因素方差分析比較不同組間的宮頸長度 唉匾, 采用 Pearson 相關分析孕周和宮頸長度的相關性 , 采用受試者工作曲線 (ROC) 分析宮頸長度預測早產的風險 ;上述統(tǒng)計學分析均采用 S P S S 2 3. 0 統(tǒng)計軟件進行分析 ; 檢驗 水準 α = 0. 0 5 。
下面是分步解讀
- 研究對象的基本特征
計量資料采用 (x ± s) 進行統(tǒng)計描述 箫锤, 定性資料采用頻數(shù)和構成比描述 逛钻,103 例研究對象的基本特征僚焦。 平均年齡為 (32.44 ± 4.31) 歲 ,平均孕周為 (35.11 ± 2.15) 周 曙痘, 早產史和分娩時的孕周比例 芳悲。
1.計量資料以 x±s 表示(x:均值;s:標準差)
2.數(shù)據(jù)類型
在醫(yī)學論文中边坤,數(shù)據(jù)分為三種類型:計數(shù)名扛,計量和等級。
計數(shù)數(shù)據(jù)是定性觀察的結果, 例如患者的性別惩嘉、職業(yè)等等罢洲。統(tǒng)計指標是各個屬性或類別的計數(shù),率文黎,結構百分比等等惹苗。
計量數(shù)據(jù)是定量觀察的結果, 通常有度量單位,例如患者的年齡 耸峭、血壓桩蓉、心率等等。統(tǒng)計指標常用平均數(shù)±標準差來表示劳闹。
等級數(shù)據(jù)介于定性觀察和定量觀察之間院究。觀察結果有等級或程度上的差別, 但不能用數(shù)量表示,例如療效評價(包括無效本涕,有效业汰,顯著等)。
http://www.datasoldier.net/archives/1408
==所以文章中的計量資料表示方式如下圖==
若是計數(shù)資料菩颖,就涉及到率的可信區(qū)間样漆、單個率的比較、多個率的比較晦闰。
若是計量資料放祟,就涉及到均值的可信區(qū)間、單個均值的比較呻右、多個均值的比較跪妥。
上圖中可見標注綠色的是計量資料,就是用的 (x ± s) 進行描述的声滥,其他未標注綠色的是計數(shù)資料眉撵,用的是就是構成比例%進行描述。
http://paper.dxy.cn/article/278773
3.描述性統(tǒng)計
描述性統(tǒng)計包含多種基本描述統(tǒng)計量,讓用戶對于數(shù)據(jù)結構可以有一個初步的認識执桌。
在此所提供之統(tǒng)計量包含:
基本信息:樣本數(shù)鄙皇、總和
集中趨勢:均值、中位數(shù)仰挣、眾數(shù)
離散趨勢:方差(標準差)伴逸、變異系數(shù)、全距(最小值膘壶、最大值)错蝴、內四分位距(25%分位數(shù)、75%分位數(shù))
-
分布描述:峰度系數(shù)颓芭、偏度系數(shù)
均數(shù)mean
中位數(shù)median
方差var
標準差sd
變異系數(shù)(Coefficient of Variation):sd(Nile)/mean(Nile)
4.采用 t 檢驗或單因素方差
- 不同孕周的產婦的宮頸長度
經單因素方差分析 顷锰, 四組研究對象的宮頸長度具有統(tǒng)計學差異 (F=62.797,P<0.0001);經 LSD 兩兩比較 亡问, 各組之間均具有統(tǒng)計學差異 (31 ~ 32 周 vs 28 ~ 30 周除外)
比較兩個獨立分組在單一變量上的均值官紫,可以使用獨立樣本t檢驗,也可以使用單因素方差分析州藕。
如果比較三個或三個以上分組時就會使用方差分析束世。
兩者的結論是一樣的,t檢驗得到 t 值床玻,方差分析得到 F 比率毁涉, F 比率是t 值的平方。
進行單因素方差分析時锈死,需要一個分類(或名義)變量作為自變量贫堰,以及一個連續(xù)變量(例如考試成績)作為因變量,自變量至少分出兩個獨立的組別待牵。
------參考《白話統(tǒng)計學》第10章-單因子方差分析
F值:組均值之間的平均差異于各組內部的平均變異之比其屏,即表明整體而言組均值之間是否存在顯著差異。但不能止于F值缨该,接下來進行事后檢驗可以確定哪幾組不同漫玄,就用可以用多重比較法。
==F值的計算公式如下==
==關于F值的計算過程舉例如下圖==
- 這篇文章中算出的F值是62.797压彭,==對應著附錄表pdf文檔的附表五:F 分布臨界值表(α=0.05),因此分子分子自由度為4(總共5組渗常,5-1=4)壮不,5組共有103例研究對象,分母自由度是103-5=98皱碘,對應著附錄表5中的α值=0.05時询一,F(xiàn)臨界值是2.47和2.46之間,而本文算出的F值是62.797,遠大于2.47健蕊,所以對應的p值是<0.0001,這個結論認為結果是統(tǒng)計顯著的菱阵。(這里的α和p值的含義是差不多的,都是代表統(tǒng)計結果是否顯著的)==
5.多重比較
LSD: 方差分析主要是用于多組均值比較的缩功,方差分析的結果是多組均值之間是否有顯著性差異晴及,但是這個顯著性差異是整體的顯著性差異,可是我們并不知道具體是哪些組之間有顯著性差異嫡锌。所以就有了多重比較虑稼,目的就是為了獲取具體哪些組之間有顯著差異。其中有一個方法稱為“Fisher 氏最小顯著差檢驗(Fisher's least significant difference, 簡稱LSD 檢驗)”
下面的這個鏈接中舉了一個很好的例子势木,有助于理解老師的文章中的一句描述就是------經 LSD 兩兩比較 蛛倦, 各組之間均具有統(tǒng)計學差異 (31 ~ 32 周 vs 28 ~ 30 周除外)
https://blog.csdn.net/junhongzhang/article/details/102774432
- 宮頸長度與孕周的相關性
采用 Preason 相關分析宮頸長度與孕周間的相關性 ,分析結果顯示 啦桌,宮頸長度與孕周呈負相關關系 溯壶, 具有統(tǒng)計學意義 (r= -0.745,P<0.0001)甫男,提示: 宮頸長度對孕周的增大而降低
6.相關性分析
對兩個或兩個以上變量的關系的研究就是相關性分析且改,變量間關聯(lián)的最基本測度之一是相關系數(shù),科學研究中最常用的就是皮爾遜積差相關系數(shù)( Preason )查剖,對于計算皮爾遜相關系數(shù)而言钾虐,要求兩個變量必須是定距或定比的連續(xù)變量。相關性有正相關和負相關笋庄,分別用正和負號表示效扫。“-” 表示負相關直砂。相關系數(shù)絕對值>0.5(或正或負)菌仁,表示強相關。Preason相關系數(shù)的符號==用r表示==静暂,當計算相關性系數(shù)時济丘,如果想知道檢驗相關系數(shù)是否統(tǒng)計顯著,常用==t分布檢驗==來檢驗相關系數(shù)是否統(tǒng)計顯著洽蛀。
==下面是t值的計算公式==
老師的文章中的r是0.745摹迷,N是103,自由度就是103-2=101郊供,計算后t值是11.22峡碉,去附錄表pdf文檔的附表三: t 分布臨界值表得到df自由度是100時對應的t值是2.626,這是的p值是0.005驮审,我們計算的11.22要遠大于2.626,所以顯著性p值要更加小鲫寄,就是更顯著(但是我沒找到更全面的對應表吉执,意思大概是這樣的)
- 宮頸長度預測早產風險 ROC 曲線
采用 ROC 曲線分析宮頸長度預測早產風險的價 值 , 見圖 3 地来。 宮頸長度預測早產風險的 ROC 曲線顯
示 戳玫,宮頸長度對預測雙胎早產具有較高的臨床價值
7.ROC曲線和AUC面積
第一個指標---==縱軸==TPR,要越高越好。而把沒病的樣本誤診為有病的,也就是第二個指標---==橫軸==FPR,要越低越好未斑,所以就是曲線上的點越靠近左上角咕宿,AUC的面積越大,這樣的結果就是預測的結果越接近實際的結果颂碧。
https://mp.weixin.qq.com/s/RGCER1Wp3jU2DPWfT3J51g
文章中的AUC面積是0.8246荠列,是很高的結果,一般大于0.7都是很好的預測模型载城。同時還是需要P值來對這個模型是否統(tǒng)計顯著進行描述肌似,P<0.05就可以。文章中的宮頸長度預測早產風險的靈敏度為 97.83% 诉瓦、診 斷 截 斷點為27. 58 mm 川队、 特異度為 66.67% 是計算AUC面積過程中產生的值,置信區(qū)間也是睬澡。