python下載小說(shuō)

下載新筆趣閣小說(shuō)

采用了requests庫(kù)锌云,代碼修改一下文件存放的文章瞳脓,以及添加一下小說(shuō)目錄就可以使用.
代碼百度云

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 08:39:52 2018

@author: dflx
"""

import requests
import re
import time
import os
import requests.packages.urllib3.util.ssl_
requests.packages.urllib3.util.ssl_.DEFAULT_CIPHERS = 'ALL'
import urllib3.contrib.pyopenssl
urllib3.contrib.pyopenssl.inject_into_urllib3()

def get_html(url):
    header ={
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.3.2.17331',
}
# 使用request庫(kù)傳參時(shí)不需要使用urlencode函數(shù)去編碼成byte類(lèi)型數(shù)據(jù)雀哨,庫(kù)自動(dòng)去編碼。get方法參數(shù)是params=,post方法是data=
    response = requests.get(url,headers = header,verify=False)
    response.encoding=response.apparent_encoding
    html=response.text
    return html

def novel_information(html,reg):
    novel_text=re.findall(reg,html)
    #print(novel_text)
    return novel_text

def get_regular_text(text):
    global count
    print("------get rgulax text----")
    #print(type(text[0]),'length=',len(text))
  
    new_word=text
    if ' ' in text[0]:
        new_word=re.sub(r' ',' ',text[0])
    print(type(new_word),'length=',len(new_word))
    if '<br />' in new_word:
        new_word=re.sub(r'<br />','\n',new_word)
    count+=len(new_word)
    return new_word

def get_onechapter(url):
    html = get_html(url)
    re1 = r'<h1>(.*?)</h1>'
    re2 = r'<div id="content">(.*?)</div>'
    novel_chapter_name = novel_information(html, re1)
    text = novel_information(html, re2)
    print("下載:------",count)
    print(novel_chapter_name)
    chapt_text="                "+novel_chapter_name[0]+'\n'+get_regular_text(text)
    return chapt_text
    
def download_onechapter(words):
#下面是文件存目錄圆恤,修改你的路徑
    path="/home/dflx/下載/novel/永夜君王.txt"
    with open(path,'a+',encoding="utf-8") as f:
        for word in words:
            f.write(word)
        f.write('\n')
        
def chapter_all(url,re3,host):
    html=get_html(url)
    #print(html)
    chapter_list=novel_information(html,re3)
    print("length=",len(chapter_list),type(chapter_list))
    chapters=[host+ i for i in chapter_list]
    chapters=[i+'.html' for i in chapters]
    print(chapters)
    #print(chapters.index("https://www.xxbiquge.com/68_68479/4010677.html"))
    return chapters


def download_novel(url_all):
    #for index in range(472,len(url_all)):
    for chapt in url_all:
        try:
            words=get_onechapter(chapt)
            download_onechapter(words)
        except Exception:
            continue
        finally:
            print("GOTO ANOTHER CHAPTER")

    
count=0;
def  main():
    host="https://www.xxbiquge.com"
#下面是小說(shuō)目錄界面赤兴,可以打開(kāi)參考一下,修改成你需要的.
    url0="https://www.xxbiquge.com/1_1797/"
    re3=r'<dd><a href="(.*?).html"'
    start=time.clock();
    try:
        all=chapter_all(url0,re3,host)
        download_novel(all)
    except Exception as e:
        print("has error"+str(e))
    finally:
        end=time.clock()
        print("總計(jì)用時(shí):%.2f s"%(end-start))


圖片.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末俭尖,一起剝皮案震驚了整個(gè)濱河市氢惋,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖明肮,帶你破解...
    沈念sama閱讀 221,695評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件菱农,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡柿估,警方通過(guò)查閱死者的電腦和手機(jī)循未,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)秫舌,“玉大人的妖,你說(shuō)我怎么就攤上這事∽阍桑” “怎么了嫂粟?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,130評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀(guān)的道長(zhǎng)墨缘。 經(jīng)常有香客問(wèn)我星虹,道長(zhǎng),這世上最難降的妖魔是什么镊讼? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,648評(píng)論 1 297
  • 正文 為了忘掉前任宽涌,我火速辦了婚禮,結(jié)果婚禮上蝶棋,老公的妹妹穿的比我還像新娘卸亮。我一直安慰自己,他們只是感情好玩裙,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,655評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布兼贸。 她就那樣靜靜地躺著,像睡著了一般吃溅。 火紅的嫁衣襯著肌膚如雪溶诞。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,268評(píng)論 1 309
  • 那天罕偎,我揣著相機(jī)與錄音很澄,去河邊找鬼。 笑死颜及,一個(gè)胖子當(dāng)著我的面吹牛甩苛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播俏站,決...
    沈念sama閱讀 40,835評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼讯蒲,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了肄扎?” 一聲冷哼從身側(cè)響起墨林,我...
    開(kāi)封第一講書(shū)人閱讀 39,740評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤赁酝,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后旭等,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體酌呆,經(jīng)...
    沈念sama閱讀 46,286評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,375評(píng)論 3 340
  • 正文 我和宋清朗相戀三年搔耕,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了隙袁。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,505評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡弃榨,死狀恐怖菩收,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情鲸睛,我是刑警寧澤娜饵,帶...
    沈念sama閱讀 36,185評(píng)論 5 350
  • 正文 年R本政府宣布,位于F島的核電站官辈,受9級(jí)特大地震影響箱舞,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜拳亿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,873評(píng)論 3 333
  • 文/蒙蒙 一褐缠、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧风瘦,春花似錦、人聲如沸公般。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,357評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)官帘。三九已至瞬雹,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間刽虹,已是汗流浹背酗捌。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,466評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留涌哲,地道東北人胖缤。 一個(gè)月前我還...
    沈念sama閱讀 48,921評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像阀圾,于是被迫代替她去往敵國(guó)和親哪廓。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,515評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容