Python 淘寶爬蟲selenium 模擬瀏覽器

encoding=utf8

import re
from pyquery import PyQuery as pq
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
browser = webdriver.Chrome('C:\Program Files (x86)\Google\Chrome\Application/chromedriver.exe')
wait=WebDriverWait(browser, 10)
def search():
try:
browser.get('https://www.taobao.com')
#獲取并設(shè)置搜索框
input = wait.until(
#加載成功
EC.presence_of_element_located((By.CSS_SELECTOR, "#q"))
)
#獲取并設(shè)置點擊按鈕
submit = wait.until(
EC.element_to_be_clickable((By.CSS_SELECTOR, "#J_TSearchForm > div.search-button > button")))
#模擬給搜索框一個關(guān)鍵字
input.send_keys('美食'.decode('utf8'))
#模擬點擊按鈕
submit.click()
totalpage = wait.until(
EC.presence_of_element_located((By.CSS_SELECTOR, "#mainsrp-pager > div > div > div > div.total"))
)
get_product()
return totalpage.text
except Exception, e:
return search()
def next_page(page_number):
try:
# 獲取并設(shè)置搜索框
input = wait.until(
EC.presence_of_element_located((By.CSS_SELECTOR, "#mainsrp-pager > div > div > div > div.form > input"))
)
# 獲取并設(shè)置點擊按鈕
submit = wait.until(
EC.element_to_be_clickable((By.CSS_SELECTOR, "#mainsrp-pager > div > div > div > div.form > span.btn.J_Submit")))
# 模擬給搜索框一個關(guān)鍵字
input.clear()
input.send_keys(page_number)
# 模擬點擊按鈕
submit.click()
wait.until(EC.text_to_be_present_in_element((By.CSS_SELECTOR,'#mainsrp-pager > div > div > div > ul > li:nth-child(3) > a'),str(page_number)))
get_product()
except Exception, e:
return search()
def main():
totalpage=search()
totalpage=int(re.compile('(\d+)').search(totalpage).group(1))
for i in range(2,totalpage+1):
next_page(i)
def get_product():
# 加載成功
wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "#mainsrp-itemlist .items .item")))
html=browser.page_source
#print type(html)
doc=pq(html)
#print doc
#items()可以獲取所有被選中的內(nèi)容
items=doc('#mainsrp-itemlist .items .item').items()
for item in items:
product={
'image':item.find('.pic .img').attr('src')
}
print product

if name =='main':
main()

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子赌厅,更是在濱河造成了極大的恐慌贮勃,老刑警劉巖棉安,帶你破解...
    沈念sama閱讀 212,080評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異酿雪,居然都是意外死亡遏暴,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,422評論 3 385
  • 文/潘曉璐 我一進店門指黎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來朋凉,“玉大人,你說我怎么就攤上這事醋安≡优恚” “怎么了?”我有些...
    開封第一講書人閱讀 157,630評論 0 348
  • 文/不壞的土叔 我叫張陵吓揪,是天一觀的道長亲怠。 經(jīng)常有香客問我,道長柠辞,這世上最難降的妖魔是什么团秽? 我笑而不...
    開封第一講書人閱讀 56,554評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮叭首,結(jié)果婚禮上习勤,老公的妹妹穿的比我還像新娘。我一直安慰自己焙格,他們只是感情好图毕,可當我...
    茶點故事閱讀 65,662評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著眷唉,像睡著了一般予颤。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上冬阳,一...
    開封第一講書人閱讀 49,856評論 1 290
  • 那天蛤虐,我揣著相機與錄音,去河邊找鬼摩泪。 笑死,一個胖子當著我的面吹牛劫谅,可吹牛的內(nèi)容都是我干的见坑。 我是一名探鬼主播嚷掠,決...
    沈念sama閱讀 39,014評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼荞驴!你這毒婦竟也來了不皆?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,752評論 0 268
  • 序言:老撾萬榮一對情侶失蹤熊楼,失蹤者是張志新(化名)和其女友劉穎霹娄,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體鲫骗,經(jīng)...
    沈念sama閱讀 44,212評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡犬耻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,541評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了执泰。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片枕磁。...
    茶點故事閱讀 38,687評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖术吝,靈堂內(nèi)的尸體忽然破棺而出计济,到底是詐尸還是另有隱情,我是刑警寧澤排苍,帶...
    沈念sama閱讀 34,347評論 4 331
  • 正文 年R本政府宣布沦寂,位于F島的核電站,受9級特大地震影響淘衙,放射性物質(zhì)發(fā)生泄漏传藏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,973評論 3 315
  • 文/蒙蒙 一幔翰、第九天 我趴在偏房一處隱蔽的房頂上張望漩氨。 院中可真熱鬧,春花似錦遗增、人聲如沸叫惊。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,777評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽霍狰。三九已至,卻和暖如春饰及,著一層夾襖步出監(jiān)牢的瞬間蔗坯,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,006評論 1 266
  • 我被黑心中介騙來泰國打工燎含, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留宾濒,地道東北人。 一個月前我還...
    沈念sama閱讀 46,406評論 2 360
  • 正文 我出身青樓屏箍,卻偏偏與公主長得像绘梦,于是被迫代替她去往敵國和親橘忱。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,576評論 2 349

推薦閱讀更多精彩內(nèi)容

  • 本文是我接觸爬蟲以來卸奉,第三套爬蟲的代碼記錄博客钝诚。本文主要是記錄淘寶搜索美食的頁面信息,工具是selenium 和 ...
    小白猿閱讀 1,061評論 1 9
  • 轉(zhuǎn)自Selenium WebDriver注意:本章內(nèi)容官方團隊正在完善中榄棵。 介紹 WebDriver### Sel...
    抓兔子的貓閱讀 7,707評論 2 22
  • *emmm...既然都下了軟件了那就搬搬文存存檔凝颇。 *前方ooc預(yù)警 一. 孟章怕黑。 噓疹鳄,不要聲張拧略。為王者怕黑,...
    南山有月閱讀 555評論 0 2
  • 我身邊的一個朋友尚辑。 我和他共同加了校會的一個部門辑鲤,這個部門,事情比較多杠茬,而且雜月褥。 我們經(jīng)常收到部長給我們私發(fā)的微信...
    好吃的焦同學(xué)閱讀 660評論 0 1
  • 活動主題:一泓 讀書思享會 歡樂聚(第二期) 活動宗旨:心向陽光-愿你被溫暖以待 活動內(nèi)容: 1.賞花賞陽光,探險...
    彥值圈閱讀 449評論 0 2