Xpath
'article' 選取所有 article 元素的所有子節(jié)點
'/article' 選取根元素 article
'article/a' 選取所有屬于 article 的子元素的 a 元素
'//div' 選取所有 div 子元素( 無論出現(xiàn)在文檔任何地方 )
'article//div' 選取所有屬于 article 元素的后代的 div 元素, 不管它出現(xiàn)在 article 之下的任何位置
'//@class' 選取所有名為 class 的屬性
'/article/div[1]' 選取屬于article子元素的第一個div元素
'/article/div[last()]' 選取屬于article子元素的最后一個div元素
'/article/div[last()-1]' 選取屬于 article 子元素的最后第二個div元素
'//div[@lang]' 選取所有l(wèi)ang屬性的div元素
'//div[@lang="eng"]' 選取所有屬性lang值為eng的div元素
'/div/*' 選取屬于div元素的所有子節(jié)點
'//*' 選取所有元素
'//div[@*]' 選取所有帶屬性的div元素
'/div/a | //div/p'
'//span | //ul' 選取文檔中所有的 span 和 ul 元素
'article/div/p | //span' 選取所有article下的div下的p元素 和 文檔中的所有span元素
# 函數(shù)
'div[contains(@id, "first")]' id是first的div元素
'a[text() = "baidu"]' 文本是baidu的a元素
'div[starts-with(@id, "first")]' id以first開頭的div元素
'input[@name="id" and not(contains(@class, "fuck"))]' name屬性是id 并且 沒有fuck類的input元素
'input[not(@id)]' 不包含id屬性的input元素
CSS選擇器
'*' 選擇所有節(jié)點
'#container' 選擇id為container的節(jié)點
'.container' 選擇所有class包含container的節(jié)點
'li a' 選取所有l(wèi)i下的所有a節(jié)點
'ul + p' 選擇ul后面的第一個p元素
'div#container > ul' 選取id為container的div的ul子元素
’p ~ ul' 選擇前面有<p>元素的每個<ul>元素
'a[title]' 選取所有有title屬性的a元素
'a[ 選取所有href屬性為 jobbole.com 值的a元素
'a[href*="jobole"]' 選取所有href屬性包含 jobbole 的a元素
'a[href^="http"]' 選取所有href屬性值以http開頭的a元素
'a[href$=".jpg"]' 選取所有href屬性值以.jpg結尾的a元素
'input[type=radio]:checked' 選擇選中的radio的元素
'div:not(#container)' 選取所有id非container的div屬性
'ii:nth-child(3)' 選取第三個li元素
'tr:nth-child(2n)' 第偶數(shù)個tr