正則表達(dá)式庫
import re
常用符號(hào)
. : 匹配任意字符(一個(gè)‘.’ 代表一個(gè)占位符,單獨(dú)使用不包括換行符‘\n’)
* : 匹配前一個(gè)字符0次或無限次
? : 匹配前一個(gè)字符0次或一次
.* :貪心算法
.*然评?:非貪心算法
() : 括號(hào)里面的值作為返回結(jié)果
常用方法
findall():匹配所有符合規(guī)律的內(nèi)容股缸,返回包含結(jié)果的列表
search(): 匹配并提取第一個(gè)符合規(guī)律的內(nèi)容勾习,返回一個(gè)正則表達(dá)式對(duì)象(object)
sub(): 替換符合規(guī)律的內(nèi)容爪喘,返回替換后的值
re.S 的功能
使 '.' 能匹配新的一行 包括\n 換行符
匹配純數(shù)字
re.findall('(\d+)',str)
利用正則實(shí)現(xiàn)翻頁功能
old_url = http://www.string.com/course/?pageNum=2
new_link = re.sub('pageNum=\d+','pageNum=%d'%i,old_url)