今天新學(xué)了一個(gè)所謂最簡(jiǎn)單的R包
主要總結(jié)如下
新建表格
鍵值對(duì)對(duì)應(yīng)關(guān)系key-value,如samplename和expression
reshape data
命令生成 a<-data.frame(country = c("A","B","c"),"1999"=paste(c(0.7,23,25),"k"),"2000"=paste(c(2,3,50),"k"))
gather(a,X1999,X2000,key = "year",value = "cases")
gather括號(hào)里的分別是:,數(shù)據(jù)框名,需合并的列名(兩個(gè)),合并后的key列名捕儒,value列名。
或者 gather(a,"year","cases",X1999,X2000)
或者排除法gather(a,year,cases,-country)用于列名較多的情況
Handle Missing Values
X<-read.csv('doudou.txt')
csv的導(dǎo)入和導(dǎo)出方式
導(dǎo)入:X<-read.csv('doudou.csv')
導(dǎo)出:write.csv(X,'doudou.csv')
drop_na():有空值的,整行刪除掉
括號(hào)里填數(shù)據(jù)框名桥滨,依據(jù)的列名(有空值那一列的列名)
例如drop_na(x,X2)
fill()窝爪,根據(jù)上一行的數(shù)值填充上,例如fill(x,X2)
replace_na()齐媒,空值填進(jìn)去特定的一個(gè)數(shù)值(還是在應(yīng)付)
括號(hào)里填數(shù)據(jù)框名蒲每,要填的列名=要填的值,例如 replace_na(x, list(X2=3))
實(shí)例結(jié)果如下
Expand table
complete(x,nesting(bioplanet),fill=list(X2=5))
當(dāng)用com.csv文件
可用命令其中的三個(gè)空值,填充上ddd relate
com <- read.csv("com.csv")
complete(com,nesting(geneid,samplename,expression),fill=list(Annotion="ddd relate"))
Expand
據(jù)說(shuō)對(duì)a變量輸入如下命令喻括,但是好像并沒(méi)有反應(yīng)邀杏??唬血?望蜡?
pin2<-data.frame(GeneId =rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
split cells(選修)
今天的內(nèi)容有些沒(méi)有領(lǐng)會(huì),還得再研究研究