利用R進(jìn)行數(shù)據(jù)處理

一、數(shù)據(jù)讀取

在利用R處理數(shù)據(jù)時根悼,發(fā)現(xiàn)數(shù)據(jù)會有一些缺失挤巡,這時R就會報錯

image.png
正如報錯所示矿卑,第一行相比于其余行缺一個數(shù)據(jù)母廷,這時我們可以利用skip=1這個函數(shù)跳過第一行糊肤,但大多數(shù)據(jù)并不是僅僅只有第一行缺數(shù)據(jù)椎咧,這時我們可以利用fill=T來填補(bǔ)空余的數(shù)據(jù)把介。
Go <- read.table("~/bulk_RNA/merge_bulk_RNA/GO/new.Annot.txt",head=T,sep="\t",fill = T)
這個時候就可以正常讀入了,一些無數(shù)據(jù)的空就以空格填補(bǔ)了脚牍。

二诸狭、數(shù)據(jù)處理

1君纫、數(shù)據(jù)拆分

有時我們的數(shù)據(jù)是這樣的
image.png
但我們想處理成這種的
image.png

就是將每一個symbol號與一個GO_ID號相對應(yīng)驯遇,這樣方便后期做富集分析,我們對數(shù)據(jù)做以下處理:
a.將GO.Compoment按照蓄髓;分割

# 初始化一個新的數(shù)據(jù)框
new_GO_term_BP <- data.frame(
  Column1 = character(0),
  Column2 = character(0),
  Column3 = character(0)
 )
# 遍歷原始數(shù)據(jù)框的每一行
for (i in 1:nrow(GO_term_BP)) {
  # 使用strsplit將第三列的數(shù)據(jù)按分號分割成向量
  split_values <- unlist(strsplit(GO_term_BP$GO.Process[i], ";"))
  # 創(chuàng)建一個與分割后的數(shù)據(jù)長度相等的數(shù)據(jù)框
  temp_df_BP <- data.frame(
    Column1 = rep(GO_term_BP$GeneID[i], length(split_values)),
    Column2 = rep(GO_term_BP$Symbol[i], length(split_values)),
    Column3 = split_values
  )
  # 將temp_df添加到新的數(shù)據(jù)框中
  new_GO_term_BP <- rbind(new_GO_term_BP, GO_term_BP)
}

得到如下結(jié)果
image.png

但運(yùn)行時間比較長叉庐,還是后臺服務(wù)器提交方便。

分割后得到如下結(jié)果
image.png
可以看到我們此時再需將GO term按照//分割為兩列即可会喝。
split_data <- strsplit(new_GO_term_BP$Column3, "http://", fixed = TRUE)

# 創(chuàng)建一個新的數(shù)據(jù)框
new_df <- data.frame(
  Column1 = new_GO_term_BP$Column1,
  Column2 = new_GO_term_BP$Column2,
  NewColumn1 = sapply(split_data, function(x) x[1]),
  NewColumn2 = sapply(split_data, function(x) x[2])
)

此時數(shù)據(jù)就成了我們想要的
image.png

以上數(shù)據(jù)再進(jìn)行一些簡單的分列即可陡叠。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市肢执,隨后出現(xiàn)的幾起案子枉阵,更是在濱河造成了極大的恐慌,老刑警劉巖预茄,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異斋攀,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進(jìn)店門旦袋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來商乎,“玉大人,你說我怎么就攤上這事。” “怎么了颖系?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長不傅。 經(jīng)常有香客問我崖疤,道長,這世上最難降的妖魔是什么权烧? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任舌涨,我火速辦了婚禮温技,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好沸毁,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般广恢。 火紅的嫁衣襯著肌膚如雪钠署。 梳的紋絲不亂的頭發(fā)上趣惠,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天,我揣著相機(jī)與錄音涨颜,去河邊找鬼钉汗。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的就乓。 我是一名探鬼主播伤锚,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了堡距?” 一聲冷哼從身側(cè)響起缸废,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤零酪,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后煌集,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡瓣蛀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年器腋,在試婚紗的時候發(fā)現(xiàn)自己被綠了纫塌。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片措左。...
    茶點(diǎn)故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖诬辈,靈堂內(nèi)的尸體忽然破棺而出口渔,到底是詐尸還是另有隱情陨亡,我是刑警寧澤绣的,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站欲账,受9級特大地震影響屡江,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜赛不,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一惩嘉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧踢故,春花似錦文黎、人聲如沸惹苗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽桩蓉。三九已至,卻和暖如春劳闹,著一層夾襖步出監(jiān)牢的瞬間触机,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工玷或, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留儡首,地道東北人。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓偏友,卻偏偏與公主長得像蔬胯,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子位他,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容