神經(jīng)網(wǎng)絡(luò)
leengsmile
2016年9月21日
神經(jīng)網(wǎng)絡(luò)
本文介紹R語言中神經(jīng)網(wǎng)絡(luò)的使用琴许,并對西瓜數(shù)據(jù)集做分類預(yù)測细溅。
為保證數(shù)據(jù)的可重復(fù)性罐监,需要先設(shè)置隨機(jī)數(shù)種子梳庆。
set.seed(1071)
首先讀入西瓜數(shù)據(jù)集3.0
watermelon_3.0 <- read.csv("data/watermelon_3.0.csv", header = TRUE,
fileEncoding = "UTF8", row.names = "編號")
head(watermelon_3.0)
## 色澤 根蒂 敲聲 紋理 臍部 觸感 密度 含糖率 好瓜
## 1 青綠 蜷縮 濁響 清晰 凹陷 硬滑 0.697 0.460 是
## 2 烏黑 蜷縮 沉悶 清晰 凹陷 硬滑 0.774 0.376 是
## 3 烏黑 蜷縮 濁響 清晰 凹陷 硬滑 0.634 0.264 是
## 4 青綠 蜷縮 沉悶 清晰 凹陷 硬滑 0.608 0.318 是
## 5 淺白 蜷縮 濁響 清晰 凹陷 硬滑 0.556 0.215 是
## 6 青綠 稍蜷 濁響 清晰 稍凹 軟粘 0.403 0.237 是
由于有categorical
變量唐责,由于后面使用的neuralnet
只是別數(shù)字型變量鳞溉,因此構(gòu)造one hot encoding
的數(shù)據(jù),將其變成數(shù)值型編碼鼠哥。
require(caret)
require(magrittr) # %>%
dummies <- dummyVars( ~ ., data = watermelon_3.0, levelsOnly = TRUE, fullRank = TRUE)
watermelon <- predict(dummies, newdata = watermelon_3.0) %>% as.data.frame()
#watermelon$好瓜 <- watermelon_3.0$好瓜
構(gòu)建神經(jīng)網(wǎng)絡(luò)模型
require(neuralnet)
predictors <- setdiff(names(watermelon), "好瓜")
formula <- names(watermelon) %>% setdiff("是") %>% paste(collapse = "+")
formula <- paste("是 ~", formula, sep = "") %>% as.formula()
nn <- neuralnet(formula = formula, data = watermelon,
hidden = c(3), err.fct = "ce",
linear.output = FALSE)
neuralnet
中的參數(shù)formula
表示將要擬合的模型熟菲,data
是數(shù)據(jù)集。注意朴恳,neuralnet
的formula
不支持"y ~ ."的形式抄罕,需要寫出完整的公式形式。而hidden
一個向量于颖,表示每個隱藏層的神經(jīng)元個數(shù)呆贿,向量的長度即為隱含層的層數(shù)。在上面的例子中森渐,hidden = c(3)
表示只有一個隱含層做入,該層含三個功能神經(jīng)元冒晰。linear.output
表明是需要回歸 linear.output = TRUE 還是需要分類 linear.output = FALSE。[5]
訓(xùn)練的模型如下:
# Do NOT run this chunk
plot(nn)
在Rmarkdown
中運(yùn)行plot
函數(shù)時母蛛,并不能成功繪制神經(jīng)網(wǎng)絡(luò)的圖翩剪,出現(xiàn)的是一系列的warning。
預(yù)測結(jié)果
require(dplyr)
pred <- neuralnet::compute(nn, dplyr::select(watermelon, -是))
result <- pred$net.result
對結(jié)果進(jìn)行預(yù)測彩郊,用的是compute
函數(shù),而不是其他包中的predict
函數(shù)蚪缀。對原始西瓜數(shù)據(jù)的預(yù)測結(jié)果存放于result
變量中秫逝,是[0, 1]
之間的實(shí)數(shù),類似于logistic regression
中的概率询枚,可以先對其進(jìn)行處理违帆。
predicted <- ifelse(result > 0.5, "是", "否")
table(watermelon_3.0$好瓜, predicted, dnn = c("真實(shí)值", "預(yù)測值"))
## 預(yù)測值
## 真實(shí)值 否 是
## 否 9 0
## 是 0 8
預(yù)測錯誤的情況有0。
參考
- http://amunategui.github.io/dummyVar-Walkthrough/
- http://stackoverflow.com/questions/33911358/using-neural-networks-neuralnet-in-r-to-predict-factor-values
- https://beckmw.wordpress.com/2013/11/14/visualizing-neural-networks-in-r-update/
- https://www.reddit.com/r/MachineLearning/comments/3y16vh/how_can_i_do_simultaneous_one_hot_encoding_in_r
- https://www.r-bloggers.com/fitting-a-neural-network-in-r-neuralnet-package/