一踊跟、長矩陣和寬矩陣
每個變量單獨(dú)成一列的為寬矩陣覆醇,例如:
N A C T G pos
1 0.00044 0.21212 0.26264 0.05120 0.47360 1
2 0.00000 0.18766 0.28970 0.32026 0.20238 2
3 0.00000 0.19334 0.32042 0.27598 0.21026 3
4 0.00000 0.14242 0.38242 0.32514 0.15002 4
5 0.00000 0.33694 0.17736 0.30862 0.17708 5
6 0.00000 0.31716 0.15932 0.14728 0.37624 6
而長數(shù)據(jù)中變量的NACTG五種堿基類型并沒有單獨(dú)列成一列捆姜,而是整合在同一列妆够。
pos variable value
1 1 G 0.47360
2 5 G 0.17708
3 9 G 0.25448
4 13 G 0.32480
5 17 G 0.25384
6 21 G 0.25868
7 25 G 0.25894
8 29 G 0.24990
9 33 G 0.25688
0 37 G 0.25468
上面兩個矩陣表達(dá)的內(nèi)容相同识啦,寬矩陣人類好讀懂,長矩陣計算機(jī)方便處理神妹,長矩陣中一列代表變量類型颓哮,另外一列表示對用的變量值。我們的ggplot對于長矩陣的畫圖相當(dāng)方便鸵荠。
Wide- to long-format data: the melt function
首先查看一下數(shù)據(jù):
head(res_per)
N A C T G pos
1 0.00044 0.21212 0.26264 0.05120 0.47360 1
2 0.00000 0.18766 0.28970 0.32026 0.20238 2
3 0.00000 0.19334 0.32042 0.27598 0.21026 3
4 0.00000 0.14242 0.38242 0.32514 0.15002 4
5 0.00000 0.33694 0.17736 0.30862 0.17708 5
6 0.00000 0.31716 0.15932 0.14728 0.37624 6
使用melt進(jìn)行轉(zhuǎn)換
res_per <- rbind.data.frame(gc_cont(R1),gc_cont(R2))
res_per$pos <- 1:nrow(res_per)
res_final <- melt(res_per,id.vars = c("pos"))
head(res_final)
pos variable value
1 1 N 0.00044
2 2 N 0.00000
3 3 N 0.00000
4 4 N 0.00000
5 5 N 0.00000
6 6 N 0.00000
之后 我們可以方便的進(jìn)行繪圖了~
還有些長款矩陣的互換的參數(shù)調(diào)整冕茅,我先挖個坑 爭取兩三天更新此文 謝謝。