XPath是一種十分強(qiáng)大的定位元素的方法,XPath定位和CSS定位相比有更大的靈活性。本篇文章的重點(diǎn)主要講解“xpath元素定位的基本方法”,希望感興趣的小伙伴可以堅(jiān)持看下去同時(shí)歡迎提出寶貴的意見讓我們一起進(jìn)步碳柱!
01:XPath簡(jiǎn)單介紹
1)概述:XPath(XML Path Language)是W3C定義的用來在XML文檔中選擇節(jié)點(diǎn)的語(yǔ)言蓄愁。
2)支持:主流瀏覽器(Chrome、Firefox,Edge,Safari)也支持XPath語(yǔ)法
3)特點(diǎn):語(yǔ)法非常像Linux系統(tǒng)中的路徑,所以又叫做路徑表達(dá)式
4)場(chǎng)景:XPath有從當(dāng)前節(jié)點(diǎn)選擇父節(jié)點(diǎn)的功能,這是CSS selector所不具備的
前置條件:
from selenium import webdriver
driver=webdriver.Chrome()
driver.implicitly_wait(5)
driver.get('https://www.51job.com/')
02:XPath語(yǔ)法結(jié)構(gòu)
1)絕對(duì)路徑:從根節(jié)點(diǎn)(html)開始, 路徑分割符是/,類似css中的>符號(hào)。如:/html/body/div
2)相對(duì)路徑:以//開頭后面加元素名稱, 用法類似于css中的后代選擇器融涣。//表示從當(dāng)前節(jié)點(diǎn)尋找所有的后代元素,不管它在什么位置。如://span
3)組合使用://div/p/span
4)通配符:*,表示匹配所有元素精钮。
5)用法://div/* ;表示匹配div下面所有元素
(1)絕對(duì)路徑寫法:選擇html文檔對(duì)應(yīng)路徑下的div元素
div=driver.find_elements_by_xpath('/html/body/div')
(2)相對(duì)路徑寫法:選擇html文檔下所有的div元素
div=driver.find_elements_by_xpath('//div')
(3)組合路徑寫法:p和span分別屬于div元素的子元素與孫元素
div=driver.find_elements_by_xpath('//div/p/span')
(4)通配符寫法:匹配div下面所有元素
div=driver.find_elements_by_xpath('//div/*')
03:根據(jù)屬性選擇
1)使用場(chǎng)景:選擇具有某個(gè)屬性(值)的元素
2)表示方法:屬性前面加一個(gè)[@屬性],屬性值必須加引號(hào)
①//*[@屬性] 表示選擇具有某個(gè)屬性的元素
②//*[@屬性=“屬性值”] 表示選擇具有某個(gè)屬性值的元素,屬性值必須加引號(hào)(單引號(hào)雙引號(hào)都可以)
③包含某(value)屬性:/*[contains(@屬性,“value”)]
④某屬性以value開頭://*[starts-with(@屬性,“value”)]
⑤某屬性以value結(jié)尾://*[ends-with(@屬性,“value”)]
⑥多屬性組合使用://*[@屬性=“屬性值”][@屬性=“屬性值”]
⑦and和or組合使用://*[@屬性=“屬性值”or/and@屬性=“屬性值”]
3)注意事項(xiàng):在xpath中沒有表示id和class的特殊方法,id 威鹿、class 也是屬性
(1)根據(jù)id屬性選擇
div=driver.find_elements_by_xpath('//div/p/input[@id="kwdselectid"]')
(2)根據(jù)class屬性選擇
div=driver.find_elements_by_xpath('//div/p[@class="ipt"]')
(3)包含ufm屬性的元素
div=driver.find_elements_by_xpath('//div[contains(@class,"ufm")]')
(4)以u(píng)fm屬性開頭的元素
div=driver.find_elements_by_xpath('//div[starts-with(@class,"ufm")]')
(5)多屬性組合使用
div=driver.find_elements_by_xpath('//iframe[@name="login_iframe"][@onload="load()"]')
(6)and和or的使用
div=driver.find_elements_by_xpath('//input[@type="hidden" or @id="showguide"]')符合其中一個(gè)
div=driver.find_elements_by_xpath('//input[@type="hidden" and @id="showguide"]')兩者都符合
04:根據(jù)子元素選擇-單選
1)表示方法:如//ul[@id="languagelist"]/li[1],若不寫元素類型可以直接寫*(通配符)
①正數(shù)第一個(gè)://*[@屬性=“屬性值”]/元素[n]或者“[n]等價(jià)于[position()=n]”
②倒數(shù)第一個(gè)://*[@屬性=“屬性值”]/元素[last()]或者“[last()]等價(jià)于[position()=last()]”
③倒數(shù)第二個(gè)://*[@屬性=“屬性值”]/元素[last()-1]或者“[last()-1]等價(jià)于[position()=last()-1]”
2)使用場(chǎng)景:選擇屬于其父元素的第n個(gè)某個(gè)類型的子元素
(1)定位ul下的正數(shù)第一個(gè)li元素
li=driver.find_elements_by_xpath('//ul[@id="languagelist"]/li[1]')
li=driver.find_elements_by_xpath('//ul[@id="languagelist"]/li[position()=1]')
(2)定位ul下的倒數(shù)第一個(gè)li元素
li=driver.find_elements_by_xpath('//ul[@id="languagelist"]/li[last()]')
li=driver.find_elements_by_xpath('//ul[@id="languagelist"]/li[position()=last()]')
(3)定位ul下的倒數(shù)第二個(gè)li元素
li=driver.find_elements_by_xpath('//ul[@id="languagelist"]/li[last()-1]')
li=driver.find_elements_by_xpath('//ul[@id="languagelist"]/li[position()=last()-1]')
05:根據(jù)子元素選擇-多選
1)表示方法:如//ul[@id="languagelist"]/li[position()=last()-1]
①前2個(gè)://*[@屬性=“屬性值”]/元素[position()<3]
②除了最后1個(gè)://*[@屬性=“屬性值”]/元素[position()<last()]
2)使用場(chǎng)景:選擇屬于其父元素的第m到n之間某個(gè)類型的子元素
(1)定位ul下的前2個(gè)li元素
li=driver.find_elements_by_xpath('//ul[@id="languagelist"]/li[position()<3]')
(2)定位ul下的除了倒數(shù)第一個(gè)li元素(最后一個(gè)元素之前的元素)
li=driver.find_elements_by_xpath('//ul[@id="languagelist"]/li[position()<last()]')
06:根據(jù)組選擇元素
1)表示方法:<s1>|<s2>;<s1>和<s2> 是兩組xpath選擇器
2)使用場(chǎng)景:用于多組xpath表達(dá)式組合來選擇元素的情況
3)注意事項(xiàng):css和xpath的表達(dá)式不能混用
ele=driver.find_elements_by_xpath('//ul[@id="languagelist"]/li[1]|//div[@class="app"]')
07:根據(jù)相鄰兄弟選擇元素
1)表示方法:如//div[@class="app"]/following-sibling::div
①選擇后面的兄弟元素://*/following-sibling::
②選擇前面的兄弟元素://*/preceding-sibling::
2)使用場(chǎng)景:根據(jù)同級(jí)元素選擇其他的同級(jí)元素
(1)選擇后面的兄弟元素
ele=driver.find_elements_by_xpath('//div[@class="app"]/following-sibling::div')
ele=driver.find_elements_by_xpath('//div[@class="app"]/following-sibling::div[1]')
(2)選擇前面的兄弟元素
ele=driver.find_elements_by_xpath('//div[@class="app"]/preceding-sibling::div')
ele=driver.find_elements_by_xpath('//div[@class="app"]/preceding-sibling::div[1]')
(3)選擇距離li元素最遠(yuǎn)的兄弟元素
ele=driver.find_elements_by_xpath('//div[@class="app"]//following-sibling::li[last()]')
(4)選擇li元素后面第2個(gè)到最后一個(gè)的兄弟元素
ele=driver.find_elements_by_xpath('//div[@class="app"]//following-sibling::li[position()>1]')
08:根據(jù)父元素選擇
1)表示方法://p/.. ;選擇p的父元素
2)使用場(chǎng)景:根據(jù)子元素定位父元素
ele=driver.find_elements_by_xpath('//div[@class="app"]/..')
09:調(diào)用當(dāng)前webelement內(nèi)部使用XPath小技巧(.)
如果是從當(dāng)前webelement調(diào)用find_element_by_xpath,需要在表達(dá)式前面加個(gè)相對(duì)路徑點(diǎn)“.”
div=driver.find_element_by_id('many')
ele=div.find_elements_by_xpath('.//*[@class="special"]')
10:驗(yàn)證XPath方法
①打開控制臺(tái),element標(biāo)簽內(nèi)查找,會(huì)做字符匹配。比如:/html/body/div
②打開控制臺(tái),console內(nèi)查找,更精確轨香。比如:$x('/html/body/div')