判斷GEO芯片數(shù)據(jù)表達(dá)矩陣是否需要log2轉(zhuǎn)換

通過exprs函數(shù)獲取表達(dá)矩陣后我們可以通過以下三種方法判斷是否需要進(jìn)行l(wèi)og2轉(zhuǎn)換

1.肉眼識(shí)別

最簡(jiǎn)單粗暴的方法就是辆飘,根據(jù)數(shù)值大小粗略估計(jì):
如果表達(dá)量的數(shù)值在50以內(nèi)啦辐,通常是經(jīng)過log2轉(zhuǎn)化后的。如果數(shù)字在幾百幾千蜈项,則是未經(jīng)轉(zhuǎn)化的芹关。因?yàn)?的幾十次方已經(jīng)非常巨大,如果2的幾百次方紧卒,則不符合實(shí)際情況侥衬。

比如,下面這個(gè)矩陣跑芳,我們?nèi)庋劬湍芸吹綌?shù)值都是個(gè)位數(shù)字轴总,最大也就十幾,這就是log處理過的:



這個(gè)矩陣數(shù)字就很大博个,這時(shí)候需要log2轉(zhuǎn)換:


2.根據(jù)標(biāo)準(zhǔn)化處理方法推算

GSE數(shù)據(jù)下載界面中的SOFT文件和Series Matrix File(s)文件中均有描述該系列的數(shù)據(jù)是如何進(jìn)行標(biāo)準(zhǔn)化處理的怀樟,常見的標(biāo)準(zhǔn)化處理方法有3種:RMA算法、GC-RMA算法盆佣、MAS5算法往堡,其中前兩中算法的返回值已經(jīng)經(jīng)過log2轉(zhuǎn)換,可直接進(jìn)行差異表達(dá)分析共耍,第三種算法返回值未經(jīng)過log2轉(zhuǎn)換虑灰,需要自行進(jìn)行l(wèi)og2轉(zhuǎn)換


打開下載好的Series Matrix File(s)文件—GSE42872_series_matrix.txt痹兜,查看數(shù)據(jù)使用的是哪種標(biāo)準(zhǔn)化處理方法穆咐。

發(fā)現(xiàn)使用的是RMA算法,我們知道該算法的返回值已經(jīng)經(jīng)過log2轉(zhuǎn)換佃蚜,可直接進(jìn)行差異表達(dá)分析庸娱。

3.使用腳本自動(dòng)判斷是否需要log轉(zhuǎn)換

## 下載數(shù)據(jù)GSE42872
rm(list = ls())
library(GEOquery)
eSet <- getGEO("GSE42872", 
               destdir = '.',
               getGPL = F)


# 從eSet中提取表達(dá)矩陣exprSet
exprSet <- exprs(eSet[[1]])

#對(duì)得到的表達(dá)矩陣操作
ex <- exprSet
qx <- as.numeric(quantile(ex, c(0., 0.25, 0.5, 0.75, 0.99, 1.0), na.rm=T))
LogC <- (qx[5] > 100) ||
  (qx[6]-qx[1] > 50 && qx[2] > 0) ||
  (qx[2] > 0 && qx[2] < 1 && qx[4] > 1 && qx[4] < 2)

if (LogC) { ex[which(ex <= 0)] <- NaN
exprSet <- log2(ex)
print("log2 transform finished")}else{print("log2 transform not needed")}

這個(gè)腳本會(huì)自動(dòng)判斷是否需要log2轉(zhuǎn)化,上面我們知道GSE42872數(shù)據(jù)是log2過后的谐算,所以這里會(huì)返回:

[1] "log2 transform not needed"

如果沒有l(wèi)og話熟尉,他自動(dòng)log2,并且返回:

"log2 transform finished"

判斷是否需要log2轉(zhuǎn)換腳本來自果子學(xué)生信簡(jiǎn)書

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末洲脂,一起剝皮案震驚了整個(gè)濱河市斤儿,隨后出現(xiàn)的幾起案子剧包,更是在濱河造成了極大的恐慌,老刑警劉巖往果,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件疆液,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡陕贮,警方通過查閱死者的電腦和手機(jī)堕油,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來肮之,“玉大人掉缺,你說我怎么就攤上這事「昵埽” “怎么了眶明?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)筐高。 經(jīng)常有香客問我搜囱,道長(zhǎng),這世上最難降的妖魔是什么柑土? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任蜀肘,我火速辦了婚禮,結(jié)果婚禮上冰单,老公的妹妹穿的比我還像新娘幌缝。我一直安慰自己,他們只是感情好诫欠,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布涵卵。 她就那樣靜靜地躺著,像睡著了一般荒叼。 火紅的嫁衣襯著肌膚如雪轿偎。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天被廓,我揣著相機(jī)與錄音坏晦,去河邊找鬼。 笑死嫁乘,一個(gè)胖子當(dāng)著我的面吹牛昆婿,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蜓斧,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼仓蛆,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了挎春?” 一聲冷哼從身側(cè)響起看疙,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤豆拨,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后能庆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體施禾,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年搁胆,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了弥搞。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡丰涉,死狀恐怖拓巧,靈堂內(nèi)的尸體忽然破棺而出斯碌,到底是詐尸還是另有隱情一死,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布傻唾,位于F島的核電站投慈,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏冠骄。R本人自食惡果不足惜伪煤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望凛辣。 院中可真熱鬧抱既,春花似錦、人聲如沸扁誓。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蝗敢。三九已至捷泞,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間寿谴,已是汗流浹背锁右。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留讶泰,地道東北人咏瑟。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像痪署,于是被迫代替她去往敵國和親码泞。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 一惠桃、Python簡(jiǎn)介和環(huán)境搭建以及pip的安裝 4課時(shí)實(shí)驗(yàn)課主要內(nèi)容 【Python簡(jiǎn)介】: Python 是一個(gè)...
    _小老虎_閱讀 5,720評(píng)論 0 10
  • Hive函數(shù) Hive函數(shù) 一浦夷、關(guān)系運(yùn)算: 等值比較: = 語法:A=B操作類型:所有基本類型描述:如果表達(dá)式A與...
    依天立業(yè)閱讀 818評(píng)論 0 8
  • matlab命令 聲明:本文轉(zhuǎn)自:https://www.douban.com/note/136332003/ 侵...
    我就是個(gè)初學(xué)者閱讀 13,710評(píng)論 0 44
  • 第一章 前端三大語言:HTML(專門編寫網(wǎng)頁內(nèi)容)辖试、CSS(編寫網(wǎng)頁樣式)、JS(專門編寫網(wǎng)頁交互行為) 能簡(jiǎn)寫盡...
    fastwe閱讀 931評(píng)論 0 0
  • 總結(jié)了一些開發(fā)中常用的函數(shù): usleep() //函數(shù)延遲代碼執(zhí)行若干微秒劈狐。 unpack() //函數(shù)從二進(jìn)制...
    ADL2022閱讀 454評(píng)論 0 3