實戰(zhàn)1:抓取花瓣圖片

1、關鍵點

  • 使用selenium模擬游覽器所袁,并動態(tài)調(diào)用腳本盏档,模擬登陸及搜索操作
  • 下拉刷新
  • 創(chuàng)建文件夾、獲取文件
  • 下載資源

2燥爷、完整源碼

#該例子在2018.8.29測試可運行
from selenium import webdriver
from bs4 import BeautifulSoup  
import os
import requests
import time
from selenium.webdriver.common.keys import Keys 

brower=webdriver.PhantomJS()

class DownPicture():
    def __init__(self): 
        self.folder_path = 'C:\HuaPicture'

    #----------------------------保存圖片------------------------------------
    def save_img(self, url, file_name):
        print('開始請求圖片地址...',url)
        img = requests.get(url)
        print('開始保存圖片...')
        f = open(file_name, 'ab')
        f.write(img.content)
        print('圖片保存成功蜈亩!',file_name)
        f.close()

    #----------------------------創(chuàng)建文件夾------------------------------------
    def mkdir(self, path): 
        isExists = os.path.exists(path)
        if not isExists:
            print('創(chuàng)建名字叫做', path, '的文件夾')
            os.makedirs(path)
            print('創(chuàng)建成功!')
            return True
        else:
            print(path, '文件夾已經(jīng)存在了前翎,不再創(chuàng)建')
            return False

    #----------------------------下拉刷新------------------------------------
    def scroll_down(self, driver, times):
        for i in range(times):
            print("開始執(zhí)行第", str(i + 1),"次下拉操作")
            driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")  #執(zhí)行JavaScript實現(xiàn)網(wǎng)頁下拉倒底部
            print("第", str(i + 1), "次下拉操作執(zhí)行完畢")
            print("第", str(i + 1), "次等待網(wǎng)頁加載......")
            time.sleep(5)

    #----------------------------主函數(shù),獲得圖片------------------------------------
    def  get_pic(self):
         browser = webdriver.PhantomJS()
         browser.maximize_window()
         browser.get('http://huaban.com')
         time.sleep(10)

         #登錄
         browser.execute_script("app.requireLogin('', {to: 'login'});return false;")
         time.sleep(1)
         loginName = browser.find_element_by_name("email") 
         loginPwd = browser.find_element_by_name("password") 
         loginBtn = browser.find_elements_by_partial_link_text("登錄") 
         loginName.send_keys("838613546@qq.com") 
         loginPwd.send_keys("******") 
         loginBtn[1].click()
         print("登錄成功")
         time.sleep(10)
         #搜索
         search = browser.find_element_by_id("query")  #搜索框
         search.clear() 
         search.send_keys("花") 
         search.send_keys(Keys.RETURN) 
         time.sleep(5)
         #下拉加載數(shù)據(jù)
         self.scroll_down(browser, 4)
         #使用BeautifulSoup稚配,頁面數(shù)據(jù)文檔化
         all_a = BeautifulSoup(browser.page_source, 'lxml').find_all('img')
         #創(chuàng)建文件夾
         is_new_folder = self.mkdir(self.folder_path)
         os.chdir(self.folder_path)   #切換路徑至上面創(chuàng)建的文件夾
         file_names = os.listdir(self.folder_path)#獲取文件家中的所有文件名,類型是list

         for a in all_a: 
            img_url = a['src'] 
            if 'http' not in img_url:
                 img_url="http:"+img_url
            if 'img.hb.aicdn.com' not in img_url:
                continue
            name_start_pos = img_url.index('.com/') + 5  #通過找.com/的位置港华,來確定它之后的字符位置
            img_name = img_url[name_start_pos:] + '.jpg'

            if is_new_folder:
                self.save_img(img_url, img_name)  # 調(diào)用save_img方法來保存圖片
            else:
                if img_name not in file_names:
                    self.save_img(img_url, img_name)  # 調(diào)用save_img方法來保存圖片
                else:
                    print("該圖片已經(jīng)存在:", img_name, "道川,不再重新下載。")
               
beauty = DownPicture()  #創(chuàng)建類的實例
beauty.get_pic()  #執(zhí)行類中的方法
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末立宜,一起剝皮案震驚了整個濱河市冒萄,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌橙数,老刑警劉巖宦言,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異商模,居然都是意外死亡,警方通過查閱死者的電腦和手機蜘澜,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門施流,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人鄙信,你說我怎么就攤上這事瞪醋。” “怎么了装诡?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵银受,是天一觀的道長。 經(jīng)常有香客問我鸦采,道長宾巍,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任渔伯,我火速辦了婚禮顶霞,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己选浑,他們只是感情好蓝厌,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著古徒,像睡著了一般拓提。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上隧膘,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天代态,我揣著相機與錄音,去河邊找鬼舀寓。 笑死胆数,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的互墓。 我是一名探鬼主播必尼,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼篡撵!你這毒婦竟也來了判莉?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤育谬,失蹤者是張志新(化名)和其女友劉穎券盅,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體膛檀,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡锰镀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了咖刃。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片泳炉。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖嚎杨,靈堂內(nèi)的尸體忽然破棺而出花鹅,到底是詐尸還是另有隱情,我是刑警寧澤枫浙,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布刨肃,位于F島的核電站,受9級特大地震影響箩帚,放射性物質(zhì)發(fā)生泄漏真友。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一紧帕、第九天 我趴在偏房一處隱蔽的房頂上張望锻狗。 院中可真熱鬧,春花似錦、人聲如沸轻纪。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽刻帚。三九已至潦嘶,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間崇众,已是汗流浹背掂僵。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留顷歌,地道東北人锰蓬。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像眯漩,于是被迫代替她去往敵國和親芹扭。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容

  • 1赦抖、通過CocoaPods安裝項目名稱項目信息 AFNetworking網(wǎng)絡請求組件 FMDB本地數(shù)據(jù)庫組件 SD...
    陽明先生_x閱讀 15,968評論 3 119
  • 代碼審查注意事項 數(shù)據(jù)庫部分: 重申舱卡,數(shù)據(jù)庫表字段定義禁止“可null”,如有相關需求队萤,用空字符串或自己定義的特殊...
    環(huán)零弦閱讀 398評論 0 1
  • 文明是錯綜復雜而又很不穩(wěn)定的人際關系網(wǎng)絡轮锥, 建立起來很辛苦, 但摧毀很容易要尔。 -完- ?嚴正法律聲明 本文版權受我...
    更好時代閱讀 49評論 0 0
  • 這個細節(jié)誰懂舍杜?真實的淳貴人才是一只披著羊皮的狼!細思極恐既绩! 哈嘍大家好匆帚,甄嬛傳想必大家都看過吧吸重,大家都記得淳貴人這...
    甄嬛傳的那些事閱讀 336評論 0 1
  • 今天下午嚎幸,媽媽帶我去詩柳語言培訓班寄猩。老師非常逗,有時候很兇,小朋友也很搞笑箍铭,我告訴你們一個秘密椎镣,其實爸爸媽...
    小依涵閱讀 144評論 4 3