selenium+xpath獲取淘寶商品內(nèi)容

以前寫的第一份爬取淘寶信息培漏,當(dāng)時覺得還可以趾撵,完全就是一個面向流程的寫法。兢哭〗В》蹬粒現(xiàn)在看來,這是什么鬼篙挽。荆萤。。
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
from lxml import etree

driver = webdriver.Chrome()
driver.get('https://www.taobao.com')

driver.find_element_by_xpath('//input[@id="q"]').send_keys('Python', Keys.ENTER)
html = driver.page_source
html = etree.HTML(html)

images = html.xpath('//img[@class="J_ItemPic img"]/@data-src')
prices = html.xpath('//div[@class="items"]//strong/text()')
deals = html.xpath('//*[@class="deal-cnt"]/text()')
shops = html.xpath('//*[@class="shopname J_MouseEneterLeave J_ShopInfo"][1]/span[2]/text()')
locations = html.xpath('//div[@class="location"]/text()')


for i in range(len(images)):
    items = html.xpath('//*[@class="J_ClickStat"]')[i]
    temp = {
    'title': items.xpath('string(.)').strip(),
    'image': images[i],
    'price': prices[i],
    'deal': deals[i],
    'shop': shops[i],
    'location': locations[i],
    }
    print(temp)

對于標(biāo)題title部分,使用 //*[@class="J_ClickStat"] 定位的是48個元素, 但是直接使用/text()獲取其文本內(nèi)容會得到200多個

在這里采用一種迂回的方法

items = html.xpath('//*[@class="J_ClickStat"]')[i]
items.xpath('string(.)').strip()

先獲取當(dāng)前節(jié)點(diǎn),然后使用 string() 獲取當(dāng)前節(jié)點(diǎn)的所有文本信息,再使用 strip() 函數(shù)去掉所有的空格換行符等

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末铣卡,一起剝皮案震驚了整個濱河市链韭,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌煮落,老刑警劉巖敞峭,帶你破解...
    沈念sama閱讀 211,376評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異蝉仇,居然都是意外死亡旋讹,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評論 2 385
  • 文/潘曉璐 我一進(jìn)店門轿衔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來沉迹,“玉大人,你說我怎么就攤上這事害驹”夼唬” “怎么了?”我有些...
    開封第一講書人閱讀 156,966評論 0 347
  • 文/不壞的土叔 我叫張陵裙秋,是天一觀的道長琅拌。 經(jīng)常有香客問我,道長摘刑,這世上最難降的妖魔是什么进宝? 我笑而不...
    開封第一講書人閱讀 56,432評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮枷恕,結(jié)果婚禮上党晋,老公的妹妹穿的比我還像新娘。我一直安慰自己徐块,他們只是感情好未玻,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,519評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著胡控,像睡著了一般扳剿。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上昼激,一...
    開封第一講書人閱讀 49,792評論 1 290
  • 那天庇绽,我揣著相機(jī)與錄音,去河邊找鬼橙困。 笑死瞧掺,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的凡傅。 我是一名探鬼主播辟狈,決...
    沈念sama閱讀 38,933評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼夏跷!你這毒婦竟也來了哼转?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,701評論 0 266
  • 序言:老撾萬榮一對情侶失蹤拓春,失蹤者是張志新(化名)和其女友劉穎释簿,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體硼莽,經(jīng)...
    沈念sama閱讀 44,143評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡庶溶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,488評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了懂鸵。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片偏螺。...
    茶點(diǎn)故事閱讀 38,626評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖匆光,靈堂內(nèi)的尸體忽然破棺而出套像,到底是詐尸還是另有隱情,我是刑警寧澤终息,帶...
    沈念sama閱讀 34,292評論 4 329
  • 正文 年R本政府宣布夺巩,位于F島的核電站贞让,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏柳譬。R本人自食惡果不足惜喳张,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,896評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望美澳。 院中可真熱鬧销部,春花似錦、人聲如沸制跟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽雨膨。三九已至擂涛,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間哥放,已是汗流浹背歼指。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留甥雕,地道東北人踩身。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像社露,于是被迫代替她去往敵國和親挟阻。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,494評論 2 348

推薦閱讀更多精彩內(nèi)容