第五章高級(jí)數(shù)據(jù)管理

#5高級(jí)數(shù)據(jù)管理

y<-data.frame(name=character(0),math=numeric(0),science=numeric(0),english=numeric(0))

mydata<-edit(y)

mydata

#5.2數(shù)值和字符處理函數(shù)

#5.2.1數(shù)學(xué)函數(shù)

#5.2.2統(tǒng)計(jì)函數(shù)

dada<-scale(mydata)#數(shù)據(jù)標(biāo)準(zhǔn)化

#5.2.3概率函數(shù)

set.seed()#設(shè)定隨機(jī)種子

runif(5)#生成服從正態(tài)分布的偽隨機(jī)數(shù)

#生成服從多元正太分布的數(shù)據(jù)

library(MASS)

options(digits=3)

set.seed(1234)

mean<-c(230.7,146.7,3.6)

sigma <- matrix(c(15360.8,6721.2,-47.1,

6721.2,4700.9,-16.5,

-47.1,-16.5,0.3),nrow=3,ncol=3)

mydata<-mvrnorm(500,mean,sigma)

mydata<-as.data.frame(mydata)

names(mydata)<-c("y","x1","x2")

dim(mydata)

head(mydata,n=10)

#5.2.4字符處理函數(shù)

#5.2.5其他實(shí)用函數(shù)

#5.2.6將函數(shù)應(yīng)用于矩陣和數(shù)據(jù)框

#將函數(shù)應(yīng)用于數(shù)據(jù)對(duì)象

a<-5

sqrt(a)

b<- c(1.243,5.654,2.99)

round(b)

c<-matrix(runif(12),nrow=3)

c

log(c)

mean(c)

#將一個(gè)函數(shù)應(yīng)用到矩陣的所有行或列中

mydata<-matrix(rnorm(30),nrow=6)

mydata

apply(mydata,1,mean)#計(jì)算每行平均值

apply(mydata,2,mean)#計(jì)算每列平均值

apply(mydata,2,mean,trim=0.2)#計(jì)算每行平均值

#5.3數(shù)據(jù)處理難題的一套解決方案

options(digits=2)

setwd("e:/r")

library(xlsx)

student<-read.xlsx("student.xlsx",1)

student

roster<-data.frame(student,math,science,english,

stringAsFactor=FASLE)

z<-scale(#未完)


5-6

options(digits=2)

student<-c("J D","A W","B M",

"D J","J M","C C",

"R Y","G K","J E",

"M R")

math<-c(502,600,412,358,495,512,410,625,573,522)

science<-c(95,99,80,82,75,85,80,95,89,86)

english<-c(25,22,18,15,20,28,15,30,27,18)

roster<-data.frame(student,math,science,english,stringAsFactors=FALSE)

z<-scale(roster[,2:4])

score<-apply(z,1,mean)

roster<-cbind(roster,score)

y<-quantile(score,c(.8,.6,.4,.2))

roster$grade[score>=y[1]]<-"A"

roster$grade[score<y[1]&score>=y[2]]<-"B"

roster$grade[score<y[2]&score>=y[3]]<-"C"

roster$grade[score<y[3]&score>=y[4]]<-"D"

roster$grade[score<=y[4]]<-"F"

roster

class(roster$student)

roster$student<-as.character(roster$student)

name <- strsplit((roster$student)," ")#roster$student必須是字符變量才能用strsplit草慧?

LN<-sapply(name, "[",2)

FN<-sapply(name, "[",1)

roster<-cbind(FN,LN,roster[,-1])

roster<-roster[order(LN,FN),]

roster



#5.4控制流

#5.4.1重復(fù)和循環(huán)

for( i in 1:10) print("H")

i<-10

while(i>0) {print("h");i<- i-1}

#5.4條件執(zhí)行

#5.4.1 if-else

attach(roster)

if(is.character(math)) math<-as.factor(math)

if(!is.character(LN)) math<-as.factor(LN)else print("gggg")

#5.4.2 ifelse,二元贡耽,輸入輸出均為向量時(shí)

attach(roster)

ifelse(score>0.5,print("P"),print("f"))

outcome<-ifelse(score>0.5,"P","f")

5.4.3switch

feelings<-c("s","a")

for(i in feelings)

print(

switch(i,

h="iii",

a="tttt",

s="ccc",

a="ccc"))

#5.5用戶(hù)自編函數(shù)

mystats<-function(x,parametric=TRUE,print=FALSE){

if(parametric){center<-mean(x);spread<-sd(x)

}else{

center<-median(x);spread<-mad(x)

}

if(print&parametric){

cat("mean=",center,"\n","sd=",spread,"\n")

}else{

cat("median=",center,"\n","mad=",spread,"\n")

}

result<-list(center=center,spread=spread)

return(result)

}

#驗(yàn)證

set.seed(1234)

x<-rnorm(500)

y<-mystats(x,parametric=TRUE,print=FALSE)

#自編函數(shù)2

mydate<-function(type="long"){

switch(type,

long=format(Sys.time(),"%A %B %d %Y"),

short=format(Sys.time(),"%m-%d-%y"),

cat(type,"is not a recognizede type\n"))}

mydate("long")

mydate("short")

mydate()

mydate("dvsdf")

5.6整合和重構(gòu)

5.6.1轉(zhuǎn)置

cars<-mtcars[1:5,1:4]

cars

t(cars)

5.6.2整合數(shù)據(jù)

options(digits=3)

attach(mtcars)

mtcars

aggdata<-aggregate(mtcars,by=list(cyl,gear),FUN=mean,na.rm=TRUE)

aggdata

5.6.3reshape包融合和重鑄melt,dcast

library(reshape2)

md<-melt(mydata,id=c("id,time"))

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末偿衰,一起剝皮案震驚了整個(gè)濱河市一汽,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌碳锈,老刑警劉巖顽冶,帶你破解...
    沈念sama閱讀 211,265評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異售碳,居然都是意外死亡强重,警方通過(guò)查閱死者的電腦和手機(jī)绞呈,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)间景,“玉大人佃声,你說(shuō)我怎么就攤上這事√纫” “怎么了圾亏?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,852評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)封拧。 經(jīng)常有香客問(wèn)我召嘶,道長(zhǎng),這世上最難降的妖魔是什么哮缺? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,408評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮甲喝,結(jié)果婚禮上尝苇,老公的妹妹穿的比我還像新娘。我一直安慰自己埠胖,他們只是感情好糠溜,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評(píng)論 5 384
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著直撤,像睡著了一般非竿。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上谋竖,一...
    開(kāi)封第一講書(shū)人閱讀 49,772評(píng)論 1 290
  • 那天红柱,我揣著相機(jī)與錄音,去河邊找鬼蓖乘。 笑死锤悄,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的嘉抒。 我是一名探鬼主播零聚,決...
    沈念sama閱讀 38,921評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼些侍!你這毒婦竟也來(lái)了隶症?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,688評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤岗宣,失蹤者是張志新(化名)和其女友劉穎蚂会,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體狈定,經(jīng)...
    沈念sama閱讀 44,130評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡颂龙,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評(píng)論 2 325
  • 正文 我和宋清朗相戀三年习蓬,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片措嵌。...
    茶點(diǎn)故事閱讀 38,617評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡躲叼,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出企巢,到底是詐尸還是另有隱情枫慷,我是刑警寧澤,帶...
    沈念sama閱讀 34,276評(píng)論 4 329
  • 正文 年R本政府宣布浪规,位于F島的核電站或听,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏笋婿。R本人自食惡果不足惜誉裆,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望缸濒。 院中可真熱鬧足丢,春花似錦、人聲如沸庇配。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,740評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)捞慌。三九已至耀鸦,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間啸澡,已是汗流浹背袖订。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,967評(píng)論 1 265
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留嗅虏,地道東北人著角。 一個(gè)月前我還...
    沈念sama閱讀 46,315評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像旋恼,于是被迫代替她去往敵國(guó)和親吏口。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容