相信很多做科研的同學(xué)剛步入科學(xué)殿堂的時候汞窗,都是從學(xué)習(xí)和模仿他人的研究開始的姓赤,小編當(dāng)年也是這樣的。俗話說他山之石可以攻玉仲吏,這也是一種不錯的學(xué)習(xí)方法不铆。但是,有時候卻很難重現(xiàn)原作者的結(jié)果裹唆,甚至有時候連作者的實驗數(shù)據(jù)如何獲取誓斥,樣本如何分類都很難搞清楚。
前些日子有位同學(xué)follow一篇宮頸癌的文章许帐,
對作者是如何從307個early-stage cervical cancer (CESC)病人中根據(jù)臨床信息挑選出145個病人的過程有些疑惑劳坑。下面是原作者篩選樣本的標(biāo)準(zhǔn)。
今天小編就帶大家來重現(xiàn)這個過程成畦。首先我們要從TCGA中下載CESC的臨床信息距芬,在TCGA中搜索CESC,選擇TCGA-CESC循帐。
選擇miRNA樣本框仔,點擊307這個超鏈接。
任意選擇一個樣本惧浴,點擊進入存和。
選擇clinical,點擊10這個超鏈接衷旅。
點擊nationwidechildrens.org_clinical_patient_cesc.txt 進入
點擊Download下載捐腿,里面就包含所有樣本的臨床信息
解壓到當(dāng)前文件夾
用excel打開nationwidechildrens.org_clinical_patient_cesc.txt
刪除第一行和第三行
找到clinical_stage這一列進行篩選,根據(jù)作者原文方法部分的描述柿顶,只保留clinical stage為 stage IA2到IIA的樣本茄袖。篩選完得到182個樣本。
接下來找到pathologic_N嘁锯,進行篩選宪祥。這里需要簡單介紹一下TNM分析聂薪。N代表淋巴結(jié)。惡性腫瘤病人存在或不存在淋巴結(jié)轉(zhuǎn)移蝗羊,可能是單發(fā)轉(zhuǎn)移也可能是多發(fā)轉(zhuǎn)移藏澳。N0代表沒有淋巴結(jié)轉(zhuǎn)移,N1耀找、N2翔悠、N3代表淋巴結(jié)轉(zhuǎn)移的程度,不同腫瘤代表的程度不一樣野芒,數(shù)字越大代表淋巴結(jié)轉(zhuǎn)移越多蓄愁。經(jīng)過stage篩選之后,這里的N只有N0和N1狞悲。那么N1就代表是淋巴結(jié)轉(zhuǎn)移的樣本撮抓,也就是原文中的lymph node metastasis(LNM+)。更多臨床信息解讀可以參考腫瘤TNM分期摇锋。
這就和原文中的表1中的數(shù)字相同了丹拯。
接著我們檢查一下相應(yīng)的Tumor Grade樣本數(shù)是否正確。由于滿足上面篩選條件的樣本的Tumor Grade只有G2荸恕,G3和NA這三種了咽笼。我們把G2的數(shù)目作為G1+G2的數(shù)目,正好是17個戚炫,跟表1中的樣本數(shù)吻合。
我們把G3的數(shù)目作為G3+G4的數(shù)目媳纬。正好14個双肤,跟表1中的樣本數(shù)吻合。
而NA的個數(shù)為1钮惠,也與表1中的樣本數(shù)吻合茅糜。
挑選LNM-樣本,感興趣的同學(xué)可以練練手素挽。