爬取淘寶圖片

import requests
import os,sys
import time
import re


def get_html(http_session,url):
    r = http_session.get(url)
    r.encoding = r.apparent_encoding
    html = r.text
    return html

def get_imgurl(html):
    pic_urls = re.findall('"pic_url":"(.*?)"', html, re.S)
    img_urls = []
    for one_pic_url in pic_urls:
        img_urls.append('http:' + one_pic_url)
        print('http:' + one_pic_url)
    return img_urls

def write_tofile(img_urls,keyword,page):
    for id,img_url in enumerate(img_urls):
        pic = requests.get(img_url)
        with open(keyword+'/{}_{}.jpg'.format(page,id),'wb') as f:
            f.write(pic.content)

def main(http_session,url,keyword,page):
    html = get_html(http_session,url)
    img_urls = get_imgurl(html)
    write_tofile(img_urls,keyword,page)

if __name__=='__main__':
############################### cookie 準(zhǔn)備 ###########################################
    ori_cookie = "..." ###通過(guò) 瀏覽器F12吉嫩,Network可找到
    newcookie = ori_cookie.split(";")
    cookie = {}
    for c in newcookie:
        new_c = c.split('=',1)
        cookie[new_c[0]]=new_c[1]
    http_session = requests.session()
    requests.utils.add_dict_to_cookiejar(http_session.cookies,cookie)

############################### 輸入關(guān)鍵字价认,開(kāi)始爬取######################################
    keyword = "電腦" ###爬取關(guān)鍵字圖片
    Page = 5  ###爬取頁(yè)數(shù)
    if not os.path.exists(keyword):
        os.mkdir(keyword)
    for p in range(Page):
        url = 'http://s.taobao.com/search?q=' + keyword + '&s=' + str(p*44)
        print(url)
        main(http_session,url,keyword,p)
        time.sleep(10)
######################################################################################

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市自娩,隨后出現(xiàn)的幾起案子用踩,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,464評(píng)論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件脐彩,死亡現(xiàn)場(chǎng)離奇詭異碎乃,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)惠奸,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,033評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門梅誓,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人佛南,你說(shuō)我怎么就攤上這事梗掰。” “怎么了嗅回?”我有些...
    開(kāi)封第一講書人閱讀 169,078評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵及穗,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我绵载,道長(zhǎng)拥坛,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 59,979評(píng)論 1 299
  • 正文 為了忘掉前任尘分,我火速辦了婚禮,結(jié)果婚禮上丸氛,老公的妹妹穿的比我還像新娘培愁。我一直安慰自己,他們只是感情好缓窜,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,001評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布定续。 她就那樣靜靜地躺著,像睡著了一般禾锤。 火紅的嫁衣襯著肌膚如雪私股。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 52,584評(píng)論 1 312
  • 那天恩掷,我揣著相機(jī)與錄音倡鲸,去河邊找鬼。 笑死黄娘,一個(gè)胖子當(dāng)著我的面吹牛峭状,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播逼争,決...
    沈念sama閱讀 41,085評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼优床,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了誓焦?” 一聲冷哼從身側(cè)響起胆敞,我...
    開(kāi)封第一講書人閱讀 40,023評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后移层,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體仍翰,經(jīng)...
    沈念sama閱讀 46,555評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,626評(píng)論 3 342
  • 正文 我和宋清朗相戀三年幽钢,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了歉备。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,769評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡匪燕,死狀恐怖蕾羊,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情帽驯,我是刑警寧澤龟再,帶...
    沈念sama閱讀 36,439評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站尼变,受9級(jí)特大地震影響利凑,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜嫌术,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,115評(píng)論 3 335
  • 文/蒙蒙 一哀澈、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧度气,春花似錦割按、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 32,601評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至院领,卻和暖如春弛矛,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背比然。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,702評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工丈氓, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人强法。 一個(gè)月前我還...
    沈念sama閱讀 49,191評(píng)論 3 378
  • 正文 我出身青樓扒寄,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親拟烫。 傳聞我的和親對(duì)象是個(gè)殘疾皇子该编,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,781評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容