利用R進(jìn)行數(shù)據(jù)處理

一、數(shù)據(jù)讀取

在利用R處理數(shù)據(jù)時根悼，發(fā)現(xiàn)數(shù)據(jù)會有一些缺失挤巡，這時R就會報錯

image.png

正如報錯所示矿卑，第一行相比于其余行缺一個數(shù)據(jù)母廷，這時我們可以利用skip=1這個函數(shù)跳過第一行糊肤，但大多數(shù)據(jù)并不是僅僅只有第一行缺數(shù)據(jù)椎咧，這時我們可以利用fill=T來填補(bǔ)空余的數(shù)據(jù)把介。
Go <- read.table("~/bulk_RNA/merge_bulk_RNA/GO/new.Annot.txt",head=T,sep="\t",fill = T)
這個時候就可以正常讀入了，一些無數(shù)據(jù)的空就以空格填補(bǔ)了脚牍。

二诸狭、數(shù)據(jù)處理

1君纫、數(shù)據(jù)拆分

有時我們的數(shù)據(jù)是這樣的

image.png

但我們想處理成這種的

image.png

就是將每一個symbol號與一個GO_ID號相對應(yīng)驯遇，這樣方便后期做富集分析，我們對數(shù)據(jù)做以下處理：
a.將GO.Compoment按照蓄髓；分割

# 初始化一個新的數(shù)據(jù)框
new_GO_term_BP <- data.frame(
  Column1 = character(0),
  Column2 = character(0),
  Column3 = character(0)
 )
# 遍歷原始數(shù)據(jù)框的每一行
for (i in 1:nrow(GO_term_BP)) {
  # 使用strsplit將第三列的數(shù)據(jù)按分號分割成向量
  split_values <- unlist(strsplit(GO_term_BP$GO.Process[i], ";"))
  # 創(chuàng)建一個與分割后的數(shù)據(jù)長度相等的數(shù)據(jù)框
  temp_df_BP <- data.frame(
    Column1 = rep(GO_term_BP$GeneID[i], length(split_values)),
    Column2 = rep(GO_term_BP$Symbol[i], length(split_values)),
    Column3 = split_values
  )
  # 將temp_df添加到新的數(shù)據(jù)框中
  new_GO_term_BP <- rbind(new_GO_term_BP, GO_term_BP)
}

得到如下結(jié)果

image.png

但運(yùn)行時間比較長叉庐，還是后臺服務(wù)器提交方便。

分割后得到如下結(jié)果

image.png

可以看到我們此時再需將GO term按照//分割為兩列即可会喝。

split_data <- strsplit(new_GO_term_BP$Column3, "http://", fixed = TRUE)

# 創(chuàng)建一個新的數(shù)據(jù)框
new_df <- data.frame(
  Column1 = new_GO_term_BP$Column1,
  Column2 = new_GO_term_BP$Column2,
  NewColumn1 = sapply(split_data, function(x) x[1]),
  NewColumn2 = sapply(split_data, function(x) x[2])
)

此時數(shù)據(jù)就成了我們想要的

image.png

以上數(shù)據(jù)再進(jìn)行一些簡單的分列即可陡叠。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市肢执，隨后出現(xiàn)的幾起案子枉阵，更是在濱河造成了極大的恐慌，老刑警劉巖预茄，帶你破解...
沈念sama閱讀 218,682評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異斋攀，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,277評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門旦袋，熙熙樓的掌柜王于貴愁眉苦臉地迎上來商乎，“玉大人，你說我怎么就攤上這事。” “怎么了颖系？”我有些...
開封第一講書人閱讀 165,083評論 0贊 355
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長不傅。經(jīng)常有香客問我崖疤，道長，這世上最難降的妖魔是什么权烧？我笑而不...
開封第一講書人閱讀 58,763評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任舌涨，我火速辦了婚禮温技，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好沸毁，可當(dāng)我...
茶點(diǎn)故事閱讀 67,785評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般广恢。火紅的嫁衣襯著肌膚如雪钠署。梳的紋絲不亂的頭發(fā)上趣惠，一...
開封第一講書人閱讀 51,624評論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音涨颜，去河邊找鬼钉汗。笑死，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的就乓。我是一名探鬼主播伤锚，決...
沈念sama閱讀 40,358評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了堡距？” 一聲冷哼從身側(cè)響起缸废，我...
開封第一講書人閱讀 39,261評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤零酪，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后煌集，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,722評論 1贊 315
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡瓣蛀，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,900評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年器腋，在試婚紗的時候發(fā)現(xiàn)自己被綠了纫塌。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片措左。...
茶點(diǎn)故事閱讀 40,030評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖诬辈，靈堂內(nèi)的尸體忽然破棺而出口渔，到底是詐尸還是另有隱情陨亡，我是刑警寧澤绣的，帶...
沈念sama閱讀 35,737評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站欲账，受9級特大地震影響屡江，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜赛不，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,360評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一惩嘉、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧踢故，春花似錦文黎、人聲如沸惹苗。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,941評論 0贊 22
一樁弒父案耸峭，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽桩蓉。三九已至，卻和暖如春劳闹，著一層夾襖步出監(jiān)牢的瞬間触机，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,057評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工玷或，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留儡首，地道東北人。一個月前我還...
沈念sama閱讀 48,237評論 3贊 371
代替公主和親
正文我出身青樓偏友，卻偏偏與公主長得像蔬胯，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子位他，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,976評論 2贊 355

利用R進(jìn)行數(shù)據(jù)處理

一、數(shù)據(jù)讀取

二诸狭、數(shù)據(jù)處理

推薦閱讀更多精彩內(nèi)容