2020-04-18 今天我來總結(jié)一下正則表達(dá)式

話說這個(gè)正則氛驮,我的第一印象就是我在看到別人的爬蟲代碼的時(shí)候,別人提取網(wǎng)站用的.*?,不過我當(dāng)時(shí)也不知道什么是正則济似,怎么用矫废,為什么這么寫盏缤,完全看不懂

下面我記錄一下正則表達(dá)式的用法

首先,

import re
my_str = '我在哪蓖扑,我在車上'
mytest = re.findall(r'',my_str)

基本框架如上第三行唉铜,我們需要在 r '這里寫你的正則表達(dá)式'

一、關(guān)于re.findall(r'',str)

一律杠、基本用法

比如
1潭流、

import re
my_str = '我在哪,我在車上'
mytest = re.findall(r'我在',my_str)
print(mytest)

這里我們看到我么你的my_str有兩個(gè)'我在'俩功,所以輸出結(jié)果是

看我幻枉!我把my_str里面所有的'我在'都找出來了!

2诡蜓、

import re
my_str = '我在哪熬甫,我在車上'
mytest = re.findall(r'我在.',my_str)
print(mytest)

這里我們添加了一個(gè) . ,這個(gè)點(diǎn)叫做通配符(當(dāng)然我們?nèi)绻?個(gè)效果就是兩個(gè))


.是為了匹配'我在' 和 后面的一個(gè)字符

3、

import re
my_str = '我1在哪3蔓罚,我4在車5上67'
mytest = re.findall(r'[0-9]',my_str)
print(mytest)

[]可以用來尋找數(shù)字椿肩,0-9表示范圍


當(dāng)然不在這個(gè)范圍內(nèi)的就不會(huì)提取出來

二、這里介紹一下幾個(gè)特殊的符號(hào)用法 錨點(diǎn)元字符 ^ 和 $*

import re
my_str = '我1在哪3豺谈,我4在車5上67'
mytest = re.findall(r'^我',my_str)
print(mytest)
相對前面加一個(gè)^,表示從第一個(gè)匹配'我'
import re
my_str = '我1在哪3郑象,我4在車5上67'
mytest = re.findall(r'我$',my_str)
print(mytest)

在my_str最后尋找'我',然鵝最后是67茬末,顯然找不到

我們看看^和&一起用是什么效果

import re
my_str = '我'
mytest = re.findall(r'^我$',my_str)
print(mytest)
只有my_str這樣才能找到滿足頭尾都是'我'的字符串

三厂榛、單詞邊界\b

import re
my_str = 'welcome to my class andwelcome looking'
mytest = re.findall(r'\bwelcome\b',my_str)
print(mytest)
通常情況下,英文單詞一般是按空格隔開的丽惭,所以\b的用法就是用來判斷取英語單詞击奶,像我上面的例子就是取'welcome' (所以welcom前后都加了邊界)

四、控制次數(shù){}

import re
my_str = 'welcome toooooooooooa my class andwelcome looking'
mytest = re.findall(r'to{11}',my_str)
print(mytest)
上面的{11}是對于o的次數(shù)控制责掏,是為了節(jié)省時(shí)間柜砾,提高效率

當(dāng)然,{}也可以是范圍换衬, 如

import re
my_str = 'welcome toooooooooooa my class andwelcome looking'
mytest = re.findall(r'to{2,11}a',my_str)
print(mytest)
這里就舉的關(guān)于o{2,11}的例子

五痰驱、* + ? 的使用

1、*

import re
my_str = 'welcome toooooooooooa my class andwelcome looking'
mytest = re.findall(r'to*a',my_str)
print(mytest)
*其實(shí)和{}控制次數(shù)差不多瞳浦,只是它是表示匹配o的任意多個(gè)而已

2担映、 + 我們來看看它和*有何不同

import re
my_str = 'welcome toooooooooooa my class andwelcome looking'
mytest = re.findall(r'to+a',my_str)
print(mytest)
表面上看上去沒區(qū)別呀!但是其實(shí)是有區(qū)別的术幔,*代表任意多個(gè)(包含0個(gè))另萤,而+不是,如果這里沒有o,則該正則表達(dá)式找不到所匹配字符

3、 ? 繼續(xù)上代碼四敞!

import re
my_str = 'welcome toooooooooooa my class andwelcome looking'
mytest = re.findall(r'to?a',my_str)
print(mytest)
這個(gè)時(shí)候我們發(fā)現(xiàn)沒匹配到泛源!原因很簡單,o?只能匹配0個(gè)或者1個(gè)忿危,多于1個(gè)就不行达箍!

六、 | 的使用

import re
my_str = 'welcome to my class to andwelcome welcome class looking'
mytest = re.findall(r'welcome|to|class',my_str)
print(mytest)
滿足其中之一(用 | 隔開的為一個(gè))铺厨,就匹配

七缎玫、字符組 []

import re
my_str = 'wawaa wawab wawac wawad'
mytest = re.findall(r'wawa[acd]',my_str)
print(mytest)
[]里面是隨機(jī)之一,符合就匹配 [0-9]或者[a-z]或者[A-Z]更可以[A-Za-z0-9]一起用都是可以的解滓!另外啰嗦一句與之相反的是[^A-Za-z0-9]
這里順便插入一下赃磨,只是已經(jīng)定義好了的,可以直接使用了

貪婪模式和非貪婪模式洼裤,一般來說默認(rèn)貪婪模式

另外邻辉,說一下關(guān)于re. 的其他用法

1、re.match #從一開始進(jìn)行匹配腮鞍,第一個(gè)如果是的話返回一個(gè)對象和一個(gè)位置
2值骇、re.search #若有,則從文本中返回找到的第一個(gè)的匹配值的對象和位置
3移国、re.sub(r'替換前','替換后',str) ,這個(gè)用的比較多吱瘩,可以對于要匹配的進(jìn)行替換,然后輸出

*當(dāng)然迹缀,re.的用法還有很多使碾,不過常見的就是這幾種,好啦祝懂,今天的記錄到此位置qwq
開心到哭泣部逮,也不知道大佬什么時(shí)候可以帶我爬蟲qaq
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市嫂易,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌掐禁,老刑警劉巖怜械,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異傅事,居然都是意外死亡缕允,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進(jìn)店門蹭越,熙熙樓的掌柜王于貴愁眉苦臉地迎上來障本,“玉大人,你說我怎么就攤上這事〖菟” “怎么了案训?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長粪糙。 經(jīng)常有香客問我强霎,道長,這世上最難降的妖魔是什么蓉冈? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任城舞,我火速辦了婚禮,結(jié)果婚禮上寞酿,老公的妹妹穿的比我還像新娘家夺。我一直安慰自己,他們只是感情好伐弹,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布拉馋。 她就那樣靜靜地躺著,像睡著了一般掸茅。 火紅的嫁衣襯著肌膚如雪椅邓。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天昧狮,我揣著相機(jī)與錄音景馁,去河邊找鬼。 笑死逗鸣,一個(gè)胖子當(dāng)著我的面吹牛合住,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播撒璧,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼透葛,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了卿樱?” 一聲冷哼從身側(cè)響起僚害,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎繁调,沒想到半個(gè)月后萨蚕,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蹄胰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年岳遥,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片裕寨。...
    茶點(diǎn)故事閱讀 38,577評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡浩蓉,死狀恐怖派继,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情捻艳,我是刑警寧澤驾窟,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站讯泣,受9級特大地震影響纫普,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜好渠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一昨稼、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧拳锚,春花似錦假栓、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至杆烁,卻和暖如春牙丽,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背兔魂。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工烤芦, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人析校。 一個(gè)月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓构罗,卻偏偏與公主長得像,于是被迫代替她去往敵國和親智玻。 傳聞我的和親對象是個(gè)殘疾皇子遂唧,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容