GDC中轉(zhuǎn)錄組的表達量文件有3種類型甫恩,分別對應(yīng)著不同的定量方法。
Counts 就不用說了酌予,來看看FPKM和FPKM-UQ有啥差別磺箕,這個可以查看GDC的官方說明文檔中的轉(zhuǎn)錄組分析部分,兩者的計算公式:
????RCg: 比對到基因上的reads數(shù)量
????RCpc: 比對到所有編碼蛋白基因上的reads數(shù)量
????RCg75: 樣品中75%分位對應(yīng)的基因reads數(shù)目
?????L: 基因的長度抛虫,為外顯子長度之和
以一個計算實例來說明兩者的差別:
假設(shè)在樣品1中Gene A 的相關(guān)統(tǒng)計信息如下:
? ? 1. Gene A的長度為:3000?
? ? 2. 比對到Gene A上的reads數(shù)量:1000
? ? 3. 比對所有基因上的reads數(shù)據(jù)量:1,000,000
? ? 4. 樣品1中覆蓋75%基因的reads數(shù):2000?
那么松靡,F(xiàn)PKM和FPKM-UQ的計算結(jié)果如下:
? ? FPKM? = (1,000)*(10^9)/[(3,000)*(1,000,000)] = 333.33
????FPKM-UQ? = (1,000)*(10^9)/[(3,000)*(2,000)] = 166,666.67
那么我們一般下載那種數(shù)據(jù)比較好呢?
如果是做差異分析的話建椰,我建議采用counts 雕欺,畢竟有不少的差異分析的軟件都是基于counts數(shù)。
如果是計算樣品間的相關(guān)性棉姐,聚類等屠列,那就可以采用均一化的FPKM,和FPKM-UQ。當(dāng)然下載counts谅海,之后進行標(biāo)準(zhǔn)化脸哀,也是可以的。
所以扭吁,一般下載counts會比較好一些撞蜂。
如果你對TCGA數(shù)據(jù)挖掘有興趣的話,可以學(xué)習(xí)我們的TCGA相關(guān)課程侥袜。
《TCGA-生存分析》
https://study.163.com/course/introduction/1005645022.htm?share=1&shareId=1031484705
?《TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析》
https://study.163.com/course/introduction/1006360042.htm?share=1&shareId=1031484705
《TCGA-轉(zhuǎn)錄因子調(diào)控》
https://study.163.com/course/introduction/1005807030.htm?share=1&shareId=1031484705
更多技能學(xué)習(xí)鏈接:
http://m.study.163.com/provider/400000000234009/index.htm?share=1&shareId=1031484705
更多生物信息課程:
1. 文章越來越難發(fā)蝌诡?是你沒發(fā)現(xiàn)新思路,基因家族分析發(fā)2-4分文章簡單快速枫吧,學(xué)習(xí)鏈接:基因家族分析實操課程浦旱、基因家族文獻思路解讀
2. 轉(zhuǎn)錄組數(shù)據(jù)理解不深入?圖表看不懂九杂?點擊鏈接學(xué)習(xí)深入解讀數(shù)據(jù)結(jié)果文件颁湖,學(xué)習(xí)鏈接:轉(zhuǎn)錄組(有參)結(jié)果解讀宣蠕;轉(zhuǎn)錄組(無參)結(jié)果解讀
3. 轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA,提升你的文章檔次甥捺,學(xué)習(xí)鏈接:WGCNA-加權(quán)基因共表達網(wǎng)絡(luò)分析
4. 轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘抢蚀?學(xué)習(xí)鏈接:轉(zhuǎn)錄組標(biāo)準(zhǔn)分析后的數(shù)據(jù)挖掘、轉(zhuǎn)錄組文獻解讀
5.微生物16S/ITS/18S分析原理及結(jié)果解讀镰禾、OTU網(wǎng)絡(luò)圖繪制皿曲、cytoscape與網(wǎng)絡(luò)圖繪制課程
6. 生物信息入門到精通必修基礎(chǔ)課,學(xué)習(xí)鏈接:linux系統(tǒng)使用吴侦、perl入門到精通屋休、perl語言高級、R語言畫圖
7. 醫(yī)學(xué)相關(guān)數(shù)據(jù)挖掘課程备韧,不用做實驗也能發(fā)文章劫樟,學(xué)習(xí)鏈接:TCGA-差異基因分析、GEO芯片數(shù)據(jù)挖掘织堂、GSEA富集分析課程毅哗、TCGA臨床數(shù)據(jù)生存分析、TCGA-轉(zhuǎn)錄因子分析捧挺、TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析
8.其他課程鏈接:二代測序轉(zhuǎn)錄組數(shù)據(jù)自主分析、NCBI數(shù)據(jù)上傳尿瞭、二代測序數(shù)據(jù)解讀闽烙。