筆趣閣小說電子書生成辦法

為什么要寫這個腳本

1.收費
2.廣告
只是想干干凈凈的看小說而已

步驟

1.使用下邊的腳本,下載小說,保存成xxx.html
2.使用calibre工具,生成電子書。記得在生成電子書時屋摇,目錄結構->一級目錄,填寫//h:h4 幽邓,這樣生成的電子書就帶有目錄了炮温。
3.好了,可以美美看純凈版小說了

腳本內容

#!/usr/bin/python3
#-*-coding:utf-8-*-
#biquge小說下載
import re
import urllib.request
import ssl
from pyquery import PyQuery as pq
import time 

def getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read()
    html = html.decode('utf-8')
    return html
#下載列表
def getArticleList(listurl,contenturl_prefix):
    html=getHtml(listurl)
    doc = pq(html)
    ret=[]
    for a in doc("div#list dd a").items():
        href=contenturl_prefix+a.attr("href")
        title=a.text()
        ret.append((href,title))
    return ret
#下載內容
def getArticle(contenturl):
    html=getHtml(contenturl)
    doc = pq(html)
    return doc("div#content").html()

#
if __name__ == "__main__":
    article_list_url,article_url_prefix=("https://www.biquge.info/1_1760/","https://www.biquge.info/1_1760/")
    article_iterms = getArticleList(article_list_url,article_url_prefix)
    save2file = "/Users/myname/Downloads/xiaoshuo.html" 
    with open(save2file,'w',encoding="utf-8") as f:
        f.write("<html><body>")
        for art in article_iterms:
            content = getArticle(art[0])
            f.write("<h4>"+art[1]+"</h4>")
            f.write(content)
            print(art[1])
            time.sleep(1)
        f.write("<html><body>")

其實也就是個最簡單的爬蟲腳本牵舵,
稍作修改也適應其他小說網(wǎng)站柒啤。

加強版本,支持大本書切割

#!/usr/bin/python3
#-*-coding:utf-8-*-
#biquge小說下載
import re
import urllib.request
import ssl
from pyquery import PyQuery as pq
import time 
import sys

def getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read()
    html = html.decode('utf-8')
    return html

#下載列表
def getArticleList(listurl,contenturl_prefix):
    html=getHtml(listurl)
    doc = pq(html)
    ret=[]
    for a in doc("div#list dd a").items():
        href=contenturl_prefix+a.attr("href")
        title=a.text()
        ret.append((href,title))
    return ret

#下載內容
def getArticle(contenturl):
    html=getHtml(contenturl)
    doc = pq(html)
    return doc("div#content").html()

#清洗    
def clearArticle(content):
    #TODO 清洗畸颅,自己實現(xiàn)担巩,可以用正則、字符串替換的方式清理
    return content.replace("龗","")

#支持分割功能
if __name__ == "__main__":
    article_list_url,article_url_prefix=("https://www.biquge.info/1_1760/","https://www.biquge.info/1_1760/")
    article_iterms = getArticleList(article_list_url,article_url_prefix)
    save2file = "/Users/myname/Downloads/xiaoshuo_{0:0>4d}.html" 
    single_book_size = 100 #1本書最多有多少章節(jié)没炒,避免一本書過大涛癌,轉換失敗
    fo = None
    index=0
    book_no=1
    for art in article_iterms:
        print(art[1])
        if index%single_book_size==0:
            if fo!=None:
                fo.write("</body></html>")
                fo.close()
                fo=None
                book_no=book_no+1
            fo=open(save2file.format(book_no),'w',encoding="utf-8")
            fo.write("<html><body>")
        content = clearArticle(getArticle(art[0]))
        fo.write("<h4>"+art[1]+"</h4>")
        fo.write(content)
        time.sleep(1)#下載1篇后,休息1秒鐘送火,做一個有道德的爬蟲
        index=index+1
    if index%single_book_size!=0:
        fo.write("</body></html>")
        fo.close()
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末拳话,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子种吸,更是在濱河造成了極大的恐慌弃衍,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件骨稿,死亡現(xiàn)場離奇詭異笨鸡,居然都是意外死亡姜钳,警方通過查閱死者的電腦和手機坦冠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來哥桥,“玉大人辙浑,你說我怎么就攤上這事∧飧猓” “怎么了判呕?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵倦踢,是天一觀的道長。 經(jīng)常有香客問我侠草,道長辱挥,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任边涕,我火速辦了婚禮晤碘,結果婚禮上,老公的妹妹穿的比我還像新娘功蜓。我一直安慰自己园爷,他們只是感情好,可當我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布式撼。 她就那樣靜靜地躺著童社,像睡著了一般。 火紅的嫁衣襯著肌膚如雪著隆。 梳的紋絲不亂的頭發(fā)上扰楼,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天,我揣著相機與錄音旅东,去河邊找鬼灭抑。 笑死,一個胖子當著我的面吹牛抵代,可吹牛的內容都是我干的腾节。 我是一名探鬼主播,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼荤牍,長吁一口氣:“原來是場噩夢啊……” “哼案腺!你這毒婦竟也來了?” 一聲冷哼從身側響起康吵,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤劈榨,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后晦嵌,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體同辣,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年惭载,在試婚紗的時候發(fā)現(xiàn)自己被綠了旱函。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡描滔,死狀恐怖棒妨,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情含长,我是刑警寧澤券腔,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布伏穆,位于F島的核電站,受9級特大地震影響纷纫,放射性物質發(fā)生泄漏枕扫。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一辱魁、第九天 我趴在偏房一處隱蔽的房頂上張望铡原。 院中可真熱鬧,春花似錦商叹、人聲如沸燕刻。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽卵洗。三九已至,卻和暖如春弥咪,著一層夾襖步出監(jiān)牢的瞬間过蹂,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工聚至, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留酷勺,地道東北人。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓扳躬,卻偏偏與公主長得像脆诉,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子贷币,可洞房花燭夜當晚...
    茶點故事閱讀 42,901評論 2 345