2.3 General Variable Assumptions
2.3.1 Variable-naming Conventions
SDTM 變量的命名是根據(jù)一套慣例(CDISC Variable-naming Fragments)。名稱以 "CD "結(jié)尾的變量是相關(guān)變量的 "短 "版本,不包括 "CD "后綴沛婴。例如,--TESTCD是--TEST的簡(jiǎn)寫版本)撞芍。
TESTCD的值必須限制在8個(gè)字符以內(nèi)炎咖,不能以數(shù)字開頭练对,也不能包含字母央碟、數(shù)字或下劃線以外的字符税灌。這是為了避免與SAS v5傳輸文件的不兼容。在其他格式(如Dataset-XML)被監(jiān)管機(jī)構(gòu)接受之前亿虽,這一限制將一直有效菱涤。
由于QNAM在補(bǔ)充限定符數(shù)據(jù)集中的作用與-TESTCD相同,因此QNAM的值與-TESTCD的值受到同樣的限制洛勉。
其他 "CD "變量的值不受--TESTCD的限制粘秆。
- ETCD(the companion to ELEMENT)和TSPARMCD(the companion to TSPARM)被限制為8個(gè)字符,沒(méi)有適用于-TESTCD的字符限制收毫。這些值應(yīng)該很短攻走,以便于在編程中使用,但預(yù)計(jì)它們不需要作為變量名使用牛哺。
-
ARMCD限制為20個(gè)字符陋气,沒(méi)有適用于-TESTCD的字符限制。ARMCD的最大長(zhǎng)度比其他 "短
"變量要長(zhǎng)引润,以適應(yīng)交叉試驗(yàn)中可能需要的那種數(shù)值。例如痒玩,如果為7個(gè)周期的交叉試驗(yàn)構(gòu)建ARMCD值時(shí)淳附,每個(gè)處理都使用2個(gè)字符的縮寫,并將連字符分開蠢古,那么ARMCD值的長(zhǎng)度將是20個(gè)字符奴曙。ARMCD值的長(zhǎng)度是20。這一規(guī)則同樣適用于ACTARMCD變量草讶。應(yīng)提供變量描述性名稱(標(biāo)簽)洽糟,最多40個(gè)字符,作為所有變量的數(shù)據(jù)變量標(biāo)簽堕战,包括補(bǔ)充限定符變量坤溃。
對(duì)于同一類型的數(shù)據(jù)(即使是自定義域和補(bǔ)充限定符),變量名稱(除域的前綴外)嘱丢、格式薪介、解碼、術(shù)語(yǔ)和數(shù)據(jù)類型的使用在提交的研究中應(yīng)保持一致越驻。
2.3.2 Tow-character Domain Identifier
為了最大限度地減少為報(bào)告目的合并/連接域時(shí)的困難汁政,2個(gè)字符的域標(biāo)識(shí)符被用作大多數(shù)變量名稱的前綴道偷。
在將
SDTM 中的變量添加到標(biāo)準(zhǔn)域(standard domains)或基于一般觀測(cè)類(general
observation)創(chuàng)建自定義域時(shí),申辦者必須用該域/數(shù)據(jù)集的 2 字符域標(biāo)識(shí)符(DOMAIN)值替換一般觀測(cè)類记劈、計(jì)時(shí)和標(biāo)識(shí)符的 SDTM
表中的"--"前綴勺鸦。2個(gè)字符的域代碼,第一個(gè)字符僅限于A-Z目木,第二個(gè)字符為A-Z换途,0-9。不允許有其他字符嘶窄。這是為了與SAS
v5傳輸文件和作為電子通用技術(shù)文件(eCTD)一部分的文件命名要求相兼容怀跛。
以下變量是所有變量名稱都以域?yàn)榍熬Y這一理念的例外情況標(biāo)識(shí)符(Identifier)。
- 必要的標(biāo)識(shí)符(STUDYID柄冲、DOMAIN吻谋、USUBJID)
- 常用的分組和合并鍵(如VISIT、VISITNUM现横、VISITDY)漓拾。
- 除DMDTC和DMDY之外的所有人口統(tǒng)計(jì)學(xué)(DM)領(lǐng)域變量
- RELREC和SUPPQUAL中的所有變量,以及評(píng)論和試驗(yàn)設(shè)計(jì)數(shù)據(jù)集中的一些變量 需要的標(biāo)識(shí)符沒(méi)有前綴戒祠,因?yàn)樗鼈兺ǔT诤喜?連接觀測(cè)值時(shí)被用作鍵骇两。識(shí)別符
--SEQ和可選的標(biāo)識(shí)符--GRPID和--REFID是有前綴的,因?yàn)樗鼈兛梢栽诳缬蛴^測(cè)時(shí)作為鍵來(lái)使用姜盈。因?yàn)樗鼈兛梢栽诳缬虻挠^測(cè)值之間進(jìn)行關(guān)聯(lián)低千。
2.3.3 Use of "Subject" and USUBJID
為了與FDA指南的建議保持一致,"受試者 "被用來(lái)泛指患者和健康志愿者馏颂。術(shù)語(yǔ) "受試者 "在所有標(biāo)簽和 Define-XML文件的評(píng)論中都應(yīng)統(tǒng)一使用 "受試者 "一詞示血。為了在所有涉及產(chǎn)品的申請(qǐng)或提交的所有研究中唯一地識(shí)別受試者,應(yīng)分配一個(gè)獨(dú)特的標(biāo)識(shí)符(USUBJID)救拉,并包含在所有數(shù)據(jù)集中难审。
USUBJID值在提交的所有試驗(yàn)中,每個(gè)試驗(yàn)參與者(受試者)必須是唯一的亿絮。這意味著告喊,在提交的所有試驗(yàn)中,沒(méi)有2個(gè)或更多的受試者可以擁有相同的USUBJID派昧。此外黔姜,參加多項(xiàng)臨床試驗(yàn)的同一個(gè)人(當(dāng)知道這一點(diǎn)時(shí))必須在所有試驗(yàn)中分配相同的USUBJID值。
CDISC不推薦USUBJID值的任何特定格式斗锭,只推薦該值對(duì)提交的所有受試者以及在同一化合物的多次提交中地淀,這些值必須是唯一的。許多申辦者將研究岖是、研究地點(diǎn)和受試者的值連接到USUBJID中帮毁,但這不是一個(gè)要求实苞。任何格式的USUBJID都是可以接受的,只要這些值在所有受試者中是唯一的烈疚。
2.3.4 Text Case in Submitted Data
建議提交的文本數(shù)據(jù)都是大寫字母(如:NEGATIVE)黔牵。例外情況可能包括長(zhǎng)的文本數(shù)據(jù)(如評(píng)論文本)和查找數(shù)據(jù)集中的--測(cè)試值(如果在轉(zhuǎn)置的視圖中作為標(biāo)簽使用,在標(biāo)題的情況下可能更易讀)爷肝。來(lái)自CDISC控制術(shù)語(yǔ)或外部代碼的值的值或外部代碼(如MedDRA猾浦、SNOMED)或儀器指定的QRS儀器的響應(yīng)值。文檔中的值應(yīng)采用這些來(lái)源規(guī)定的大小寫灯抛,可能是混合大小寫金赦。文本數(shù)據(jù)中使用的大小寫必須與Define-XML文件中提供的控制術(shù)語(yǔ)中使用的大小寫一致。
2.2.5 Convention For Missing Values
單個(gè)數(shù)據(jù)項(xiàng)的缺失值應(yīng)該用空值來(lái)表示对嚼。
2.2.6 Grouping Variables and Categorization
分組變量(grouping variables)是指標(biāo)識(shí)符和限定符變量夹抗,如-CAT(類別 Category)和-SCAT (子類別 Subcategory),對(duì)SDTM領(lǐng)域/數(shù)據(jù)集中的記錄進(jìn)行分組纵竖,并可由發(fā)起人指定漠烧,對(duì)主題變量值進(jìn)行分類。例如靡砌,一個(gè)LBTEST ="SODIUM "的實(shí)驗(yàn)室記錄可能有LBCAT = "CHEMISTRY"和LBSCAT ="ELECTROLYTES"已脓。
--CAT和--SCAT的值不應(yīng)該與--CAT提供的域名或字典分類重復(fù)。DECOD和-BODSYS所提供的域名或字典分類不應(yīng)重復(fù)通殃。
How Grouping Variables Group Data
For the Subject
1. 所有具有相同USUBJID值的記錄是描述該主題的一組記錄度液。跨越主題(具有不同USUBJID值的記錄)
2. 所有具有相同DOMAIN值的記錄都是一組描述該領(lǐng)域的記錄画舌。
3. --CAT(類別)和--SCAT(子類別)值在該領(lǐng)域內(nèi)進(jìn)一步細(xì)分群體恨诱。一般來(lái)說(shuō),--CAT/--SCAT值在一個(gè)特定的領(lǐng)域內(nèi)具有意義骗炉。然而,也有可能在相關(guān)領(lǐng)域(如MH和AE)中使用相同的-CAT/-SCAT值蛇受。當(dāng)數(shù)值在不同的領(lǐng)域中使用時(shí)句葵,其意思應(yīng)該是一樣的。當(dāng)--CAT/--SCAT在不同的領(lǐng)域/數(shù)據(jù)集中可能有不同的含義時(shí)兢仰,例子包括
a.? 同一總體觀察類中的不同領(lǐng)域包含類似的概念性信息的情況乍丈。例如,不良事件(AE)把将、病史(MH)和臨床事件(CE)在概念上是相同的數(shù)據(jù)轻专,唯一的區(qū)別是事件開始的時(shí)間與研究開始的時(shí)間不同以及該事件是否被認(rèn)為是研究中可報(bào)告的不良事件。
例如:腫瘤學(xué)試驗(yàn)中收集的神經(jīng)毒性數(shù)據(jù)察蹲,既可以作為單獨(dú)的病史CRF(MH域)请垛,也可以作為不良事件CRFs(AE域)都可以識(shí)別/收集 "左臂麻痹"催训。在這兩個(gè)領(lǐng)域中,CAT變量的值可以是 "NEUROTOXICITY"宗收。
b. 需要多個(gè)數(shù)據(jù)集來(lái)采集同一主題的數(shù)據(jù)的情況漫拭。根據(jù)
腫瘤學(xué)的例子,左臂麻木的存在和開始及停止日期可以報(bào)告為不良事件(AE域)報(bào)告混稽,而事件的嚴(yán)重性則在多次訪問(wèn)中被捕獲采驻,并記錄為 "發(fā)現(xiàn)"(FA數(shù)據(jù)集)。在這兩種情況下匈勋,-CAT變量的值都可以是"神經(jīng)毒性(NEUROTOXICITY)"礼旅。
c. 有必要用多個(gè)域來(lái)捕獲一起收集的數(shù)據(jù),并且有隱含的關(guān)系洽洁,也許在相關(guān)記錄(RELREC)的特殊用途數(shù)據(jù)集中確定痘系。
例如:壓力測(cè)試數(shù)據(jù)的收集可以捕獲以下內(nèi)容。
i. 關(guān)于測(cè)試的發(fā)生诡挂、開始碎浇、停止和持續(xù)時(shí)間的信息(PR域)。
ii. 壓力測(cè)試期間記錄的生命體征(VS域)璃俗。
iii. 在壓力測(cè)試期間進(jìn)行的治療(如氧氣)(在干預(yù)域Interventions domain)奴璃。
在這種情況下,在3個(gè)獨(dú)立的領(lǐng)域中記錄的壓力測(cè)試期間收集的數(shù)據(jù)可能都有--CAT/--SCAT值(STRESS TEST)城豁,表明數(shù)據(jù)是在壓力測(cè)試期間收集的苟穆。
Differences Between Grouping Variables
--CAT/--SCAT和--GRPID之間的主要區(qū)別是。
1. --CAT/--SCAT是在收集數(shù)據(jù)之前就知道(確定)的唱星。
2. 2. --CAT/--SCAT的數(shù)值是跨主題(subject)的分組數(shù)據(jù)雳旅。
3. --CAT/--SCAT可能有一些受控的術(shù)語(yǔ)。
4. --GRPID通常在數(shù)據(jù)收集期間或之后由發(fā)起人決定分配间聊。
5. --GRPID僅在一個(gè)主題內(nèi)對(duì)數(shù)據(jù)進(jìn)行分組攒盈。
6. --GRPID值由申辦者定義,不會(huì)受到控制術(shù)語(yǔ)的影響哎榴。
因此型豁,在不同科目中相同的數(shù)據(jù)通常在--CAT/--SCAT中更合適,而在不同科目中不同的數(shù)據(jù)通常在--GRPID中更合適尚蝌。
例如迎变,作為所有受試者已知的綜合治療的一部分而使用的伴隨藥物(例如,"Mayo Clinic Regimen")飘言,更適合使用使用-CAT/-SCAT來(lái)標(biāo)識(shí)該藥物是該治療方案的一部分更為合適衣形。記錄在嚴(yán)重不良事件(SAE)中的藥物組,使用--GRPID更為合適姿鸿,因?yàn)椴煌茉囌叩姆纸M可能會(huì)有所不同谆吴。
在基于查找一般觀察類的領(lǐng)域中倒源,-RESCAT變量可用于事后分類結(jié)果。--相比之下纪铺,-CAT和-SCAT通常由申辦者定義或由研究者使用在收集時(shí)使用相速,而不是在評(píng)估Findings結(jié)果的價(jià)值后使用。