正則表達(dá)式的語法
用處:
1.判斷某個字符串是否符合某個條件
---判斷輸入的字符串是否是郵箱/手機(jī)號碼菊匿,是否是ip地址(判斷某個字符串是否符合某個規(guī)則)
2.提取滿足條件的字符串
3.字符串的替換
python中是通過re模塊中相應(yīng)的方法支持正則表達(dá)式的匹配,查找和替換功能
正則表達(dá)式包含兩個部分替蔬,一個是正則語法對應(yīng)的字符,一個是普通字符
正則表達(dá)式的特殊符號
1 . (匹配任意字符)
一個 . 只匹配一個任意字符
from re import fullmatch
re_str = r'a.b' #匹配一個長度為三,第一個為a,第二個為任意字符滔金,最后一個是b 的字符串
result = fullmatch(re_str,'acv')
print(result)
2 \w(匹配數(shù)字字母下劃線)
一個\w匹配一個字符
re_str = r'\w...' #匹配一個第一個是字母數(shù)字下劃線,后面三個為任意字符的長度為四的字符串
result = fullmatch(re_str,'accb')
print(result) #<_sre.SRE_Match object; span=(0, 4), match='accb'>
3 \s(匹配任意一個空白字符)
一個\s 匹配一個空白字符
re_str = r'\w..\s.'
result = fullmatch(re_str,'_qw r')
print(result) #<_sre.SRE_Match object; span=(0, 5), match='_qw r'>
4 \d(匹配數(shù)字字符)
re_str = r'\w\s..\d'
result = fullmatch(re_str,'1 er2')
print(result) #<_sre.SRE_Match object; span=(0, 5), match='1 er2'>
5 \b (檢測邊界)
一個\b不會去匹配一個字符茂嗓,而是單純檢測\b出現(xiàn)的位置是否是單詞邊界
單詞邊界:字符串的開始和結(jié)尾鹦蠕、空格、換行在抛、標(biāo)點(diǎn)符號等可以將兩個單詞隔開的字符都是單詞邊界
re_str = r'\b\w\s\b\d.'
result = fullmatch(re_str,'r 34')
print(result) #<_sre.SRE_Match object; span=(0, 4), match='r 34'>
6 ^(檢測是否是字符串開頭)
re_str = r'^\w\s\b.\d'
result = fullmatch(re_str,'r l5')
print(result) #<_sre.SRE_Match object; span=(0, 4), match='r l5'>
7 $(檢測是否以字符串結(jié)尾)
re_str = r'^\w.\d\s\b.$'
result = fullmatch(re_str,'wu3 r')
print(result) #<_sre.SRE_Match object; span=(0, 5), match='wu3 r'>
8 \W ----匹配非字母數(shù)字下劃線字符
\S --- 匹配非空格字符
\d ---- 匹配非數(shù)字字符
9 [] (匹配中括號中出現(xiàn)的任意一個字符)
[字符集] -- 匹配字符集中的任意一個字符
[字符1-字符2] --- 匹配字符1到字符2范圍內(nèi)的字符
注意: - 在中括號中,如果放在兩個字符之間萧恕,表示范圍刚梭。字符1的編碼值要小于字符2的編碼值
# 匹配一個第一個字符是a或者b或者c,后面是三個a
re_str = r'[abc]aaa'
result = fullmatch(re_str,'aaaa')
print(result)
result = fullmatch(re_str,'baaa')
print(result)
re_str = r'[1-4]\d\d\d'
result = fullmatch(re_str,'1456')
print(result)
# <_sre.SRE_Match object; span=(0, 4), match='aaaa'>
# <_sre.SRE_Match object; span=(0, 4), match='baaa'>
# <_sre.SRE_Match object; span=(0, 4), match='1456'>
10 [^字符集] --- 匹配一個非中括號中字符的字符
11 * (匹配0次或者多次)
re_str = r'[1-9]*'
result = fullmatch(re_str,'12123124141124')
print(result)
result = fullmatch(re_str,'')
print(result)
# <_sre.SRE_Match object; span=(0, 14), match='12123124141124'>
# <_sre.SRE_Match object; span=(0, 0), match=''>
12 + (匹配一次或者多次)
re_str = r'[a-zA-Z_]+'
result = fullmatch(re_str,'aW_weq')
print(result)
# <_sre.SRE_Match object; span=(0, 6), match='aW_weq'>
13 ?(匹配0次或者1次)
#練習(xí): 寫一個正則表達(dá)式票唆,匹配所有的整數(shù)
re_str = r'[-+]?[-1-9]+\b'
result = fullmatch(re_str,'1234')
print(result)
#<_sre.SRE_Match object; span=(0, 4), match='1234'>
14 {} (匹配指定次數(shù))
{n} ---- 匹配n次
{m朴读,n} ---- 匹配m到n次
{m,} ---- 至少匹配m次
{走趋,n} ---- 最多匹配n次
# 判斷密碼是否符合要求;密碼是由數(shù)字和字母組成衅金,并且6-16位
re_str = r'[1-9a-zA-Z]{6,16}'
result = fullmatch(re_str,'qwe123456')
print(result)
# <_sre.SRE_Match object; span=(0, 9), match='qwe123456'>
正則表達(dá)式的分之和分組
1 | (分之)
條件1 | 條件2 --- 先用條件1區(qū)匹配,如果匹配成功簿煌,就匹配成功氮唯。
如果條件1匹配失敗,就用條件2匹配姨伟。
注意: 如果條件1匹配成功就不會再用條件2再去匹配
- ()(分組)
a.組合(將括號中的內(nèi)容作為一個整體進(jìn)行操作)
b惩琉。捕獲 --- 使用帶括號的正則表達(dá)式匹配成功后,只獲取括號中的內(nèi)容
c.重復(fù)--- 在正則表達(dá)式中夺荒,可以通過 \數(shù)字 來重復(fù)前面括號中來匹配到的結(jié)果.數(shù)字代表前面第幾個分組
a.組合瞒渠,重復(fù)
re_str = r'(\d{3})op\1'
result = re.fullmatch(re_str,'123op123')
print(result)
# <_sre.SRE_Match object; span=(0, 8), match='123op123'>
b.捕獲
re_str = r'(\d{3})'
print(re.findall(re_str,'2131sadasda123asdas123xzx'))
['213', '123', '123']
####正則表達(dá)式re相關(guān)的方法
1.compile
compile(正則表達(dá)式字符串) --- 將正則表達(dá)式字符串轉(zhuǎn)換成正則表達(dá)式對象