library(rvest)
myurl <- "http://www.boohee.com/food/group/"
food_cal <- data.frame()
for(i in 1:10){ #循環(huán)采集10種類型的食物熱量
? ? ? ? food_class <- read_html(paste0(myurl,i,"?page=1")) %>%
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? html_nodes("div[class='widget-food-list pull-right'] h3") %>%
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? html_text()#獲取食物類型數(shù)據(jù)
? ? ? ?food_class <- sub("\n","",food_class)#將多余符號去掉
? ? ? ?food_class <- rep(food_class, 100) #重復(fù)100遍
? ? ? ?food_name <- c()
? ? ? ?cal <- c()
? ? ? ?for(j in 1:10){ #每種類型循環(huán)采集10頁
? ? ? ? ? ? ? ? myurlpaste <- paste0(myurl,i,"?page=",j)
? ? ? ? ? ? ? ? myweb <- read_html(myurlpaste)
? ? ? ? ? ? ? ? food_name1 <- myweb %>%
? ? ? ? ? ? ? ? ? ? ? ? ? html_nodes(".food-list li div[class = 'text-box pull-left'] a") %>%
? ? ? ? ? ? ? ? ? ? ? ? ? html_text() #食物名稱
? ? ? ? ? ? ? ?cal1 <- myweb %>%
? ? ? ? ? ? ? ? ? ? ? ? ? html_nodes(".food-list li div[class = 'text-box pull-left'] p") %>%
? ? ? ? ? ? ? ? ? ? ? ? ? html_text() #食物熱量
? ? ? ? ? ? ? food_name <- c(food_name, food_name1)
? ? ? ? ? ? ? cal <- c(cal, cal1)
? ? ? ? ? ?}
? ? ?food_cal1 <- data.frame(food_class, food_name, cal)
? ? ?food_cal <- rbind(food_cal, food_cal1)
}
write.csv(food_cal, file = "E:\\薄荷食物熱量.csv")