本篇是GBD相關(guān)的第12篇推文
這次,我們講解Age-Period-Cohort(年齡-時期-隊列模型筷登,APC模型)分析方法以及在GBD數(shù)據(jù)庫上的運用剃根。
在講解APC模型在GBD的數(shù)據(jù)庫中運用前,我們首先需要對APC模型進行簡單的介紹:APC模型主要用于對慢性病發(fā)病率和死亡率變化趨勢的分析前方,以及預(yù)測未來疾病負擔變化狈醉,其考慮因素包括年齡、時期和隊列3個因素惠险。前面2期我們將介紹APC模型在GBD疾病負擔研究發(fā)病率苗傅、死亡率等時間變化趨勢分析中的運用。
疾病的時間趨勢通常用時期效應(yīng)班巩、年齡效應(yīng)渣慕、隊列效應(yīng)、隨機變異來解釋抱慌,描述性流行病學的中心問題就是在呈現(xiàn)疾病率的條件下逊桦,解釋時期、年齡和隊列對疾病發(fā)生所產(chǎn)生的影響抑进。在APC模型中强经,時期效應(yīng)(Period effect)指人為因素影響人群疾病率的變化,比如疾病診斷技術(shù)的發(fā)展寺渗、篩查和早期檢測匿情、疾病定義及登記變化兰迫、治療改善等,這些人為因素都可能影響不同時期的疾病率码秉,產(chǎn)生時期效應(yīng)。年齡效應(yīng)(Age effect)是疾病率隨年齡變化的效應(yīng)鸡号,疾病發(fā)生最重要的決定因素之一转砖。隊列效應(yīng)(Cohort effect)指由于不同代人群暴露危險因素的程度不同而導致疾病率的變化。
大概介紹APC模型后鲸伴,我們看下今天需要用到的網(wǎng)頁軟件https://analysistools.cancer.gov/apc/府蔗,進入官網(wǎng)界面后,可以看到數(shù)據(jù)上傳一個通過復(fù)制黏貼汞窗,一個通過csv文件導入到網(wǎng)頁中姓赤。通過下圖可以看到,我們需要準備的數(shù)據(jù)是不同年齡層的疾病發(fā)仓倮簟(死亡)數(shù)以及所在年齡層的人群數(shù)不铆。
我們首先下載年齡層的人群數(shù),大家直接可以在GBD官網(wǎng)(http://ghdx.healthdata.org/record/ihme-data/gbd-2019-population-estimates-1950-2019)下載到下圖標注的3個文件
下載好后裹唆,我們打開其中一個文件查看下內(nèi)容誓斥,內(nèi)容基本上和我們下載疾病的數(shù)據(jù)相似,只是換成了population data许帐。
我們將其下載好的數(shù)據(jù)解壓至同一個文件夾中
疾病發(fā)病數(shù)據(jù)劳坑,我們以一篇已經(jīng)發(fā)表過的文章為例,進行操作講解和結(jié)果解讀成畦,這篇文章題目是《The epidemiological trends in the burden of lung cancer attributable to PM2.5 exposure in China》距芬,文章和補充材料我都會上傳,我們按照文章中的方法提取數(shù)據(jù)
設(shè)置好參數(shù)后循帐,我們下載數(shù)據(jù)框仔,需要勾選下圖這個紅色選項,方便后面的操作拄养,將其文件命名為LC存和。
接著我們需要提取數(shù)據(jù)整理成需要的文件格式,我們打開網(wǎng)頁提供的案例看下,一個方框內(nèi)代表的是不同年齡層在同一年份的疾病死亡病數(shù)以及人群總數(shù)
因此需要將下載的數(shù)據(jù)整理成如上的格式
我們打開R語言衷旅,這里我們借鑒了網(wǎng)上大佬的代碼進行了修改捐腿,文件是function_year5,功能是將5個單一的年份取平均值合并成5年的區(qū)段數(shù)據(jù)柿顶。
我們設(shè)置路徑茄袖,讀取R包以及修改后的function_year5的R文件
接著,讀取population文件嘁锯,由于Population文件是以一年為一個文件宪祥,我們設(shè)立循環(huán)來讀取其中的數(shù)據(jù)聂薪,并整理成需要的格式
同樣的,我們讀取死亡病數(shù)據(jù)蝗羊,并整理成需要的格式
針對2個數(shù)據(jù)的年齡層藏澳,取交集,使年齡層能夠一致
接著我們將兩個數(shù)據(jù)集合并整理成能夠直接復(fù)制黏貼至網(wǎng)頁版的格式
我們打開文件查看下
我們將數(shù)據(jù)復(fù)制黏貼至網(wǎng)頁版耀找,然后設(shè)置參數(shù)如下翔悠,點擊calculate.
運行之后,我們根據(jù)結(jié)果來講解幾個重要的變量
Net Drift(% per year)是最主要的結(jié)果野芒,這里代表死亡率/發(fā)病率的總體時間趨勢蓄愁,類似于死亡率的年度百分比變化,但同時考慮了歸因于period和cohort因素的趨勢的兩個組成部分狞悲。
APC 模型還估計了每個年齡組內(nèi)死亡率的時間趨勢撮抓,表示為特定年齡死亡率的年度百分比變化(Local Drift,% per year)摇锋,它反映了出生隊列效應(yīng)的趨勢丹拯,其Wald chi-squared test檢驗結(jié)果提示是否有出生隊列效應(yīng)。如果檢驗結(jié)果有統(tǒng)計學差異荸恕,一個重要的含義是單一的年齡標準化率曲線和 EAPC值不能充分描述每個年齡組的時間趨勢咽笼。
Drift的絕對值大于1%認為具有實質(zhì)變化,而其由Wald chi-squared test進行檢驗戚炫。
本次結(jié)果中剑刑,Net drift為-0.528%,具有統(tǒng)計學差異双肤,表明死亡率在降低施掏。
我們再看到local drift,可以看到以67.5歲為界茅糜,62.5歲以下的死亡率是逐年下降七芭,但67.5歲以后死亡率是逐年升高的。同時可以看到不同年齡的local drift是不同的蔑赘,Local dirft=net drift的檢驗結(jié)果提示具有統(tǒng)計學差異狸驳,支持上述結(jié)論,且ASR以及EAPC值不能充分描述每個年齡組的死亡變化時間趨勢缩赛。
此外耙箍,結(jié)果部分還展示了年齡(Age effect),時期(Period effect),出生隊列(cohort effect)相關(guān)的數(shù)據(jù)。
年齡效應(yīng)采用Longitudinal and Cross-sectional Age
Curves酥馍,其中Longitudinal Age Curves代表年齡相關(guān)的自然病程的肺癌死亡率辩昆;當從老一代到年輕一代的發(fā)病率逐漸增加時,Cross-sectional Age Curves會給人一種錯誤印象旨袒,即發(fā)病率隨著診斷年齡的增長而下降汁针。因此术辐,net drift比較小時,可以考慮使用Cross-sectional Age
Curves施无,否則需要謹慎使用辉词。Age deviations整合了Longitudinal and Cross-sectional Age Curves、Long2CrossRR猾骡,是年齡的非線性效應(yīng)瑞躺,類似于年齡的線性趨勢。在其論文中卓练,更多采用Longitudinal Age Curves來展示隘蝎。本研究中购啄,在同一出生隊列中襟企,隨著年齡的增加,其死亡率逐漸升高狮含。
時期效應(yīng)采用Fitted Temporal Trends, Period RR顽悼,Period deviations展示;在其論文中几迄,更多采用Period RR來展示蔚龙,RR>1說明該時期與參考時期比死亡/發(fā)病相對風險較高,RR<1代表該時期與參考時期比死亡/發(fā)病相對風險較低映胁。Fitted Temporal Trends是校正了的cohort deviation的參考年齡層的發(fā)病/死亡率木羹,類似于ASR值。Period
deviations整合了Fitted Temporal Trends解孙、Period RR的時期的非線性效應(yīng)坑填,類似于時期的線性趨勢。在本次研究的Period
RR結(jié)果中弛姜,其較近年份的死亡率較前緩慢下降
出生隊列效應(yīng)采用Cohort RR脐瑰、Local
Drifts展示結(jié)果。在其論文中廷臼,更多采用Cohort RR來展示苍在,RR>1說明該出生隊列與參考隊列比死亡/發(fā)病相對風險較高,RR<1代表該出生隊列與參考隊列比死亡/發(fā)病相對風險較低荠商。cohort deviations是考慮了CRR以及l(fā)ocal drift的非線性效應(yīng)寂恬,近似于線性趨勢。在本次研究中莱没,1930年以前出生的人的死亡率逐漸增加掠剑,然后在 1930 年以后出生的人中逐漸減少。
這個最終結(jié)果可以以excel或者R語言輸出格式導出郊愧,可以進一步采用R語言進行分析朴译。