Python爬蟲快看漫畫

新手學(xué)python爬蟲中,用這個網(wǎng)站練了一下手,代碼還是有點亂,還需要優(yōu)化,這是第一個版本,沒有加超線程和錯誤調(diào)試

在win10下測試通過,不知道為啥放在在linux執(zhí)行到filename那行出錯,碎覺了不改了.

import requests
from bs4 import BeautifulSoup
import os
import re

headers={'Referer': 'http://www.kuaikanmanhua.com/',
         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',}

s=requests.session()
s.headers=headers

#基本設(shè)置
#保存根路徑,默認(rèn)在當(dāng)前目錄下
basepath='./'
#漫畫集的首頁,示例見下面的網(wǎng)址
url='http://www.kuaikanmanhua.com/web/topic/2047/'

def savejpg(url,path):
    global s
    filename=re.search('.*/(.*\.jpg)',url)[1]
    res=s.get(url)
    #res=requests(url,headers=headers)
    if res.status_code==200:
        print('保存圖片'+filename+'到'+path)
        with open(path+filename,'wb') as f:
            f.write(res.content)
            f.close()

def get_imgs(url,path):
    global s
    html=s.get(url).text
    soup=BeautifulSoup(html,'html.parser')
    img_links=soup.select('.kklazy')
    for img_link in img_links:
        savejpg(img_link['data-kksrc'],path)


def parser_index(url):
    comic_img_info={}
    soup=BeautifulSoup(s.get(url).text,'html.parser')
    comic_name=soup.select('.comic-name')[0].text
    comic_titles=soup.findAll('a',attrs={'class':' article-img'})
    for titles in comic_titles:
        comic_img_info['name']=comic_name
        comic_img_info['title']=titles['title']
        comic_img_info['url']='http://www.kuaikanmanhua.com/'+titles['href']
        yield comic_img_info

def main(url=url,basepath=basepath):
    for item in parser_index(url):
        path=basepath+item['name']+'/'+item['title']+'/'
        if not os.path.exists(path):os.makedirs(path)
        get_imgs(item['url'],path)

if __name__=='__main()__':
    main()

捕獲.PNG

最后編輯于：2018.07.13 00:30:03

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末旱物，一起剝皮案震驚了整個濱河市遥缕，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌宵呛，老刑警劉巖单匣，帶你破解...
沈念sama閱讀 212,718評論 6贊 492
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異宝穗，居然都是意外死亡户秤，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,683評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門逮矛，熙熙樓的掌柜王于貴愁眉苦臉地迎上來鸡号，“玉大人，你說我怎么就攤上這事须鼎【ò椋” “怎么了府蔗？”我有些...
開封第一講書人閱讀 158,207評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長汞窗。經(jīng)常有香客問我姓赤，道長，這世上最難降的妖魔是什么仲吏？我笑而不...
開封第一講書人閱讀 56,755評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任不铆，我火速辦了婚禮，結(jié)果婚禮上裹唆，老公的妹妹穿的比我還像新娘誓斥。我一直安慰自己，他們只是感情好许帐，可當(dāng)我...
茶點故事閱讀 65,862評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布致讥。她就那樣靜靜地躺著排霉，像睡著了一般诈茧。火紅的嫁衣襯著肌膚如雪旨怠。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 50,050評論 1贊 291
城市分裂傳說
那天羡鸥，我揣著相機與錄音蔑穴，去河邊找鬼。笑死惧浴，一個胖子當(dāng)著我的面吹牛存和，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播衷旅，決...
沈念sama閱讀 39,136評論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼捐腿，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了柿顶？” 一聲冷哼從身側(cè)響起茄袖，我...
開封第一講書人閱讀 37,882評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎嘁锯，沒想到半個月后宪祥，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,330評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡家乘，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,651評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年蝗羊，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片仁锯。...
茶點故事閱讀 38,789評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡耀找，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出业崖，到底是詐尸還是另有隱情野芒，我是刑警寧澤蓄愁，帶...
沈念sama閱讀 34,477評論 4贊 333
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站狞悲，受9級特大地震影響涝登，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜效诅，卻給世界環(huán)境...
茶點故事閱讀 40,135評論 3贊 317
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望趟济。院中可真熱鬧乱投，春花似錦、人聲如沸顷编。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,864評論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽媳纬。三九已至双肤，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間钮惠，已是汗流浹背茅糜。一陣腳步聲響...
開封第一講書人閱讀 32,099評論 1贊 267
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留素挽，地道東北人蔑赘。一個月前我還...
沈念sama閱讀 46,598評論 2贊 362
代替公主和親
正文我出身青樓，卻偏偏與公主長得像预明，于是被迫代替她去往敵國和親缩赛。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 43,697評論 2贊 351

Python爬蟲快看漫畫

推薦閱讀更多精彩內(nèi)容