最近想看本網(wǎng)絡(luò)小說《大圣歸來辆它,我孫悟空誓必屠盡神佛!》履恩,這個番茄讀書锰茉,挺麻煩的,手機本來空間就不夠切心,不想裝太多軟件洞辣。
能不能把這本小說給下載下來,慢慢看昙衅,經(jīng)過幾次嘗試,用代碼全部給爬了下來定鸟。還不錯而涉,就是后面有機會把它直接轉(zhuǎn)換成DOCX文件。
代碼如下:
library(rvest)
library(stringr)
#下載《大圣歸來联予,我孫悟空誓必屠盡神佛啼县!》
web <- read_html("https://www.nztgp.org/shuwu/10966/",encoding = "GBK")
book_name <- web %>%html_nodes("div.box_con ")%>%html_nodes("div#list a") %>% html_attr("href")
#獲得章節(jié)鏈接地址
book_name<-paste0("https://www.nztgp.org",book_name)
for (i in 1:length(book_name)){
target_url<-book_name[i]
book_cont<-read_html(target_url,encoding = "GBK")
book_cont_1<-book_cont%>%html_nodes("div.box_con ")%>%html_text()
cont_title <- book_cont %>%html_nodes("div.box_con") %>%
html_nodes("div.bookname h1")%>% html_text()
cont_title<-str_sub(cont_title,start = 5, str_length(cont_title))
cont_cont <- book_cont %>%html_nodes("div.box_con") %>%
html_nodes("div#content")%>% html_text()
cont_cont<-str_replace_all(cont_cont,"\r\n","")
cont_cont<-paste0(cont_title,"\r", cont_cont)
write(cont_cont,paste0(cont_title,".txt"))
}