XPath 解析 和re正則

XPath 語法

XPath 使用路徑表達式來選取 XML 文檔中的節(jié)點或節(jié)點集端三。節(jié)點是通過沿著路徑 (path) 或者步 (steps) 來選取的。

XML 實例文檔

我們將在下面的例子中使用這個 XML 文檔蜈膨。

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>
<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>
</bookstore>

選取節(jié)點

XPath 使用路徑表達式在 XML 文檔中選取節(jié)點。節(jié)點是通過沿著路徑或者 step 來選取的。 下面列出了最有用的路徑表達式:
表達式 描述

nodename 選取此節(jié)點的所有子節(jié)點鸥鹉。

/ 從根節(jié)點選取窃植。
// 從匹配選擇的當(dāng)前節(jié)點選擇文檔中的節(jié)點帝蒿,而不考慮它們的位置。
. 選取當(dāng)前節(jié)點巷怜。
.. 選取當(dāng)前節(jié)點的父節(jié)點葛超。
@ 選取屬性暴氏。

在下面的表格中,我們已列出了一些路徑表達式以及表達式的結(jié)果:
路徑表達式 結(jié)果

bookstore 選取 bookstore 元素的所有子節(jié)點绣张。
/bookstore
選取根元素 bookstore答渔。
注釋:假如路徑起始于正斜杠( / ),則此路徑始終代表到某元素的絕對路徑侥涵!

bookstore/book 選取屬于 bookstore 的子元素的所有 book 元素沼撕。
//book 選取所有 book 子元素,而不管它們在文檔中的位置芜飘。
bookstore//book 選擇屬于 bookstore 元素的后代的所有 book 元素务豺,而不管它們位于 bookstore 之下的什么位置。
//@lang 選取名為 lang 的所有屬性嗦明。

謂語(Predicates)

謂語用來查找某個特定的節(jié)點或者包含某個指定的值的節(jié)點笼沥。
謂語被嵌在方括號中。

在下面的表格中娶牌,我們列出了帶有謂語的一些路徑表達式奔浅,以及表達式的結(jié)果:

路徑表達式 結(jié)果

/bookstore/book[1] 選取屬于 bookstore 子元素的第一個 book 元素。
/bookstore/book[last()] 選取屬于 bookstore 子元素的最后一個 book 元素诗良。
/bookstore/book[last()-1] 選取屬于 bookstore 子元素的倒數(shù)第二個 book 元素汹桦。
/bookstore/book[position()<3] 選取最前面的兩個屬于 bookstore 元素的子元素的 book 元素。
//title[@lang] 選取所有擁有名為 lang 的屬性的 title 元素鉴裹。
//title[@lang='eng'] 選取所有 title 元素舞骆,且這些元素擁有值為 eng 的 lang 屬性。
/bookstore/book[price>35.00] 選取 bookstore 元素的所有 book 元素径荔,且其中的 price 元素的值須大于 35.00葛作。
/bookstore/book[price>35.00]/title 選取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值須大于 35.00猖凛。
選取未知節(jié)點
XPath 通配符可用來選取未知的 XML 元素赂蠢。

通配符 描述

匹配任何元素節(jié)點。
@* 匹配任何屬性節(jié)點辨泳。
node() 匹配任何類型的節(jié)點虱岂。
在下面的表格中,我們列出了一些路徑表達式菠红,以及這些表達式的結(jié)果:
路徑表達式 結(jié)果
/bookstore/* 選取 bookstore 元素的所有子元素第岖。
//* 選取文檔中的所有元素。
//title[@*] 選取所有帶有屬性的 title 元素试溯。

選取若干路徑

通過在路徑表達式中使用"|"運算符蔑滓,您可以選取若干個路徑。

在下面的表格中,我們列出了一些路徑表達式键袱,以及這些表達式的結(jié)果:

路徑表達式 結(jié)果

//book/title | //book/price 選取 book 元素的所有 title 和 price 元素燎窘。
//title | //price 選取文檔中的所有 title 和 price 元素。
/bookstore/book/title | //price 選取屬于 bookstore 元素的 book 元素的所有 title 元素蹄咖,以及文檔中所有的 price 元素

<re正則

單字符匹配

. 匹配除了換行符之外的任意字符
\d 匹配數(shù)據(jù)0~9 => [0-9] => [^\D]
\D 匹配非數(shù)字 =>[^\d]
\s 匹配空白字符 空格 \n \r....
\S 匹配非空白字符
\w 匹配單詞字符[a-zA-Z0-9_]
\W 匹配非單詞字符 [^\w]
[a-z]
[1-34-9]
^ 匹配開頭
$ 匹配結(jié)尾

多字符匹配

  • 匹配* 前的表達式任意次數(shù)
  • 匹配+ 前的表達式至少1次
    褐健? 匹配?前的表達式0~1次
    {n,m} 匹配{n,m} 前的表達式n~m次
    {n} 匹配{n} 前的表達式n次
非貪婪匹配(竟可能少的匹配)

*澜汤?
+蚜迅?
??
| 或
() 分組
r 原始字符
\ 轉(zhuǎn)義符

import 導(dǎo)入re
re.compile(): 構(gòu)建正則表達式對象
re.match(): 從字符串起始位置匹配(第一個字符開始),匹配到結(jié)果,立即返回,否則俊抵,返回None谁不,單次匹配
re.search(): 從起始位置開始在整個字符串中匹配,匹配到結(jié)果,立即返回,否則徽诲,返回None拍谐,單次匹配
re.findall(): 匹配出字符串中所有符合正則表達式的結(jié)果,將匹配結(jié)果放入list中返回
re.finditer(): 匹配出字符串中所有符合正則表達式的結(jié)果,返回的是一個可迭代對象
re.split(): 根據(jù)正則表達式馏段,分割字符串
re.sub(): 根據(jù)正則表達式,替換字符串

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末践瓷,一起剝皮案震驚了整個濱河市院喜,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌晕翠,老刑警劉巖喷舀,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異淋肾,居然都是意外死亡硫麻,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進店門樊卓,熙熙樓的掌柜王于貴愁眉苦臉地迎上來拿愧,“玉大人,你說我怎么就攤上這事碌尔〗焦迹” “怎么了?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵唾戚,是天一觀的道長柳洋。 經(jīng)常有香客問我,道長叹坦,這世上最難降的妖魔是什么熊镣? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上绪囱,老公的妹妹穿的比我還像新娘测蹲。我一直安慰自己,他們只是感情好毕箍,可當(dāng)我...
    茶點故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布弛房。 她就那樣靜靜地躺著,像睡著了一般而柑。 火紅的嫁衣襯著肌膚如雪文捶。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天媒咳,我揣著相機與錄音粹排,去河邊找鬼。 笑死涩澡,一個胖子當(dāng)著我的面吹牛顽耳,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播妙同,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼射富,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了粥帚?” 一聲冷哼從身側(cè)響起胰耗,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎芒涡,沒想到半個月后柴灯,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡费尽,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年赠群,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片旱幼。...
    茶點故事閱讀 40,680評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡查描,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出柏卤,到底是詐尸還是另有隱情叹誉,我是刑警寧澤,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布闷旧,位于F島的核電站长豁,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏忙灼。R本人自食惡果不足惜匠襟,卻給世界環(huán)境...
    茶點故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一钝侠、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧酸舍,春花似錦帅韧、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至淮阐,卻和暖如春叮阅,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背泣特。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工浩姥, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人状您。 一個月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓勒叠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親膏孟。 傳聞我的和親對象是個殘疾皇子眯分,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,691評論 2 361

推薦閱讀更多精彩內(nèi)容