STEM軟件分析基因表達模式

最近有一批轉(zhuǎn)錄組數(shù)據(jù),其實不是時間序列的數(shù)據(jù)厢塘,而是從低到高有4個梯度的Al濃度處理的數(shù)據(jù)茶没,每個三個重復(fù),共有12個數(shù)據(jù)晚碾,想著看一下4個梯度處理下基因表達的模式抓半,使用了STEM軟件,mark一下用法格嘁。

2020-3-14 更新:軟件下載地址
官網(wǎng),帶文檔

STEM是分析時間序列的軟件笛求。基本介紹可參考廬州月光糕簿。其實我覺得軟件其實很容易上手探入,主要是軟件對于數(shù)據(jù)文件格式的要求。具體來說懂诗,對于基因在不同處理下的表達數(shù)據(jù)的文件獲得就得費一番功夫蜂嗽,注意一點工具手冊上說可以上傳有生物學(xué)重復(fù)的文件,但是我沒看到具體如何做殃恒,我直接將我的表達量數(shù)據(jù)在重復(fù)數(shù)據(jù)中去中位數(shù)來代表這個處理的基因表達量(軟件也是這樣做的)植旧。

  1. 選取在4組實驗組兩兩比對中有顯著表達差異的基因,然后取并集离唐。取并集需要在R中操作:
Reduce(union,list(v1=c(1,2,4,6,8),v2=c(1,4,7,9),v3=c(1,2,6,8,10)))
#需要把差異基因保存為向量的格式

然后在已經(jīng)準(zhǔn)備好的fpkm或者tpm基因表達量中篩選得到差異基因的表達量病附,也是在R中來做

sig_fpkm <- fpkm[sig,]# 前提是你已經(jīng)得到了sig(包含了差異基因名的列表),fpkm數(shù)據(jù)框的rownname也是基因名
sig_fpkm <- na.omit(sig_fpkm) # 刪除沒有匹配到行

注意,有可能最后得到的有表達量的差異基因數(shù)少于你前面得到的差異基因數(shù)亥鬓,因為有可能你的fpkm/tpm文件經(jīng)過過濾(類似于rowSums(NA)>=10完沪,rowSum <12),從而刪掉有可能在某個比對中被認為是差異基因的低表達基因嵌戈。
接下來如果你還有 GO注釋文件覆积,你需要調(diào)整格式類似于下圖格式


要求格式

如果本來原始的全部基因GO注釋文件時Excel表格類似于下圖:

原始表格

就需要進行格式轉(zhuǎn)換:
這里有一個方法

R中將兩列合為一列。然后應(yīng)該是保存為文本格式就可以了熟呛,或者保存為csv技健。然后將csv內(nèi)容復(fù)制到notepadd++里面。但是結(jié)果中會出現(xiàn)數(shù)量不一的逗號惰拱,類似于下圖:


帶有逗號的數(shù)據(jù)

需要在notepadd++通過正則去掉

(,+)$ # 替換為空

這樣就得到干凈的數(shù)據(jù)了


干凈的數(shù)據(jù)

這是所要求的全部的注釋格式。接下來是篩選,將文本在Excel中使用Excel里面的 vlookup 函數(shù)偿短。參考用法
也就是將差異基因復(fù)制到所有注釋所在的excel文檔中欣孤,而基因名應(yīng)該在第一列降传。就可以!當(dāng)然最后還是出現(xiàn)沒有匹配出現(xiàn)#N/A段只。首先數(shù)據(jù)先復(fù)制,再以只保留值得形式粘貼,然后選中有#N/A的列柠掂,CTRL + G → 定位條件→常量 只勾選錯誤,確定悉抵,如此只選中含有#N/A的單元格,右鍵刪除审磁,整行。完成!

最后就是將兩個文件瘩蚪,差異基因表達數(shù)據(jù)和對應(yīng)的注釋文件輸入到STEM軟件中崩哩,設(shè)置好參數(shù)。


上傳

結(jié)果出圖:


結(jié)果1

點擊其中一個所得基因的表達趨勢
結(jié)果2

點擊 下方對應(yīng)的按鈕就可以得到對應(yīng)的基因和GO列表,在此不贅述了。至于可以深入做GO分析细诸,需要好好研究一下手冊。

總的來說,軟件上手很容易,但是準(zhǔn)備輸入文件,調(diào)整格式需要花一番功夫
感覺,特別是對于文本操作(shell腳本沪铭,sed,正則匹配)已骇,不同格式之間的相互轉(zhuǎn)化,不同軟件的操作(R,Excel,Notepadd++),說到底還是不太熟練碘橘,基本功不扎實,有些操作應(yīng)該是有很簡單的做法吱肌,但是確實想不出來痘拆,看來還是要靜下心來把這些知識吃透,不應(yīng)該東學(xué)一點氮墨,西學(xué)一點纺蛆,什么都會一點,什么都不精通规揪。自勉G攀稀!猛铅!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末字支,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子奕坟,更是在濱河造成了極大的恐慌祥款,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件月杉,死亡現(xiàn)場離奇詭異刃跛,居然都是意外死亡,警方通過查閱死者的電腦和手機苛萎,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門桨昙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來检号,“玉大人,你說我怎么就攤上這事蛙酪∑肟粒” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵桂塞,是天一觀的道長凹蜂。 經(jīng)常有香客問我,道長阁危,這世上最難降的妖魔是什么玛痊? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮狂打,結(jié)果婚禮上擂煞,老公的妹妹穿的比我還像新娘。我一直安慰自己趴乡,他們只是感情好对省,可當(dāng)我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著晾捏,像睡著了一般蒿涎。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上粟瞬,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天同仆,我揣著相機與錄音,去河邊找鬼裙品。 笑死俗批,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的市怎。 我是一名探鬼主播岁忘,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼区匠!你這毒婦竟也來了干像?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤驰弄,失蹤者是張志新(化名)和其女友劉穎麻汰,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體戚篙,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡五鲫,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了岔擂。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片位喂。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡浪耘,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出塑崖,到底是詐尸還是另有隱情七冲,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布规婆,位于F島的核電站澜躺,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏聋呢。R本人自食惡果不足惜苗踪,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望削锰。 院中可真熱鬧,春花似錦毕莱、人聲如沸器贩。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蛹稍。三九已至,卻和暖如春部服,著一層夾襖步出監(jiān)牢的瞬間唆姐,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工廓八, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留奉芦,地道東北人。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓剧蹂,卻偏偏與公主長得像声功,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子宠叼,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容