http://blog.csdn.net/weixin_38206454/article/details/78378049
正則表達(dá)式
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
關(guān)于貪婪和非貪婪
http://www.runoob.com/regexp/regexp-syntax.html
re模塊
re.findall() 在目標(biāo)字符串查找符合規(guī)則的字符串
re.sub() 替換
re.compile 把正則表達(dá)式編譯成一個(gè)正則對象
e.g. 1
利用正則表達(dá)式抓取頁面內(nèi)容
注意python3的解碼問題
e.g. 2
一個(gè)正則調(diào)試工具:
.*? 一般用于(?)在兩個(gè)確定表達(dá)式之間表示
( ) 中的表達(dá)式作為分組捞蚂,每遇到一個(gè)編號+1
避免在樣式里面提取夺饲,在屬性里提取
html轉(zhuǎn)義(eg. ‘?’) 和 正則轉(zhuǎn)義 的不同