re.sub的功能
re是regular expression的所寫,表示正則表達式
sub是substitute的所寫匿刮,表示替換僧凰;
re.sub是個正則表達式方面的函數(shù),用來實現(xiàn)通過正則表達式熟丸,實現(xiàn)比普通字符串的replace更加強大的替換功能训措;
import re
print(re.sub(r"<span .*?>|</span>","","<span size=1>1</span><span font=sdf>2</span><span color=123>3</span>"))
運行結(jié)果:
123
re.sub的各個參數(shù)的詳細解釋
re.sub共有五個參數(shù)。
re.sub(pattern, repl, string, count=0, flags=0)
其中三個必選參數(shù):pattern, repl, string
兩個可選參數(shù):count, flags
第一個參數(shù):pattern
pattern光羞,表示正則中的模式字符串绩鸣,這個沒太多要解釋的。
第二個參數(shù):repl
repl纱兑,就是replacement呀闻,被替換,的字符串的意思潜慎。
repl可以是字符串捡多,也可以是函數(shù)蓖康。
import re;
def pythonReSubDemo():
? ? """
? ? ? ? demo Pyton re.sub
? ? """
? ? inputStr = "hello 123 world 456";
? ? def _add111(matched):
? ? ? ? intStr = matched.group("number"); #123
? ? ? ? intValue = int(intStr);
? ? ? ? addedValue = intValue + 111; #234
? ? ? ? addedValueStr = str(addedValue);
? ? ? ? return addedValueStr;
? ? replacedStr = re.sub("(?P<number>\d+)", _add111, inputStr);
? ? print "replacedStr=",replacedStr; #hello 234 world 567
第三個參數(shù):string
string,即表示要被處理垒手,要被替換的那個string字符串蒜焊。
沒什么特殊要說明。
第四個參數(shù):count
舉例說明:
繼續(xù)之前的例子科贬,假如對于匹配到的內(nèi)容泳梆,只處理其中一部分。