Linux - 正則表達式

正則表達式(Regular Expression,RE)是透過一些特殊字符的排列签赃,用以[搜尋/取代/刪除]一列或多列文字字符串,簡單的說界拦,正則表達式就是用在字符串的處理上面的一項“表達式”吸申。如果想要以正則表達式的方式處理字符串,就要使用支持正則表達式的工具程序享甸,例如 vi,grep,sed,awk等截碴。但是像cp,ls等指令并不支持正則表達式,所以就只能使用bash自己本身的通配符蛉威。

注意:

  • 正則表達式的符號與通配符是完全不一樣的東西
    因為通配符(wildcard)代表的是bash操作接口的一個功能日丹,但正則表達式則是一種字符串處理的的表示方式。兩者要分清楚啊~
  • 語系對正則表達式有影響
    因此在使用正則表達式時蚯嫌,要特別留意當時環(huán)境的語系為何哲虾,否則可能會發(fā)現(xiàn)與別人不相同的擷取結(jié)果。

下面關(guān)于正則表達式的練習和舉例择示,都使用我們熟悉的grep來展示束凑,grep是一個擷取命令,如果你不了解grep栅盲,可以從這篇小文章里簡單了解一些Linux 之 Bash -- 管線命令

grep 的一些進階選項
之所以這么說汪诉,是因為Linux 之 Bash -- 管線命令里面都沒有提到~~
工作模式:grep [-A] [-B] [--color=auto]'搜尋字符串' filename
-A 后面可加數(shù)字,為after的意思谈秫,除了列出該行外扒寄,后面的n行也列出來
-B 后面可加數(shù)字,為before的意思拟烫,除了列出該行外该编,前面的n行也列出來
--color=auto 可將正確的那個擷取數(shù)據(jù)列出顏色

1.基礎(chǔ)正則表達式

下面總結(jié)了一個精簡的基礎(chǔ)正則表達式的字符表格,不過不要局限于其中的范例啊硕淑,還要根據(jù)實際情況靈活改變课竣,它的價值可遠不止于此~

表達式 描述 范例
^ 行首標記 ^test 匹配以 test 起始的行
$ 行尾標記 test$ 匹配以 test 結(jié)尾的行
. 任意字符 t.t匹配任意代替.的一個字母(它就是英文狀態(tài)的句號)嘉赎,如txt,但不能是兩個字母如text
[] 匹配其中任意一個 t[ex]t匹配 tet 或 txt
[^] 除了其中任意一個 te[^xt] 除了 tet 和 txt 不能匹配,其他任意
[a-d] 匹配指定范圍內(nèi)任一個 能匹配a,b,c,d中任意一個字母
{n} 匹配之前n項 grep -w '[0-9]\{2\}' filename 擷取存在兩位數(shù)字的文本行
{n,m} 最少匹配n次稠氮,最多m次 [0-9]\{2,4\} 匹配2位數(shù)到4位數(shù)
{n, } 至少匹配前面n次 [0-9]\{n, \}匹配至少是兩位數(shù)的
* 匹配之前多個或沒有 tx*t 匹配 tt 或 txt/txxt/txxxt/...
\ 轉(zhuǎn)義(向來放在特殊符號前曹阔,* + 半开?等) bio\ +info 匹配bio+info

[^]表示反向選擇
[^a-z]表示非小寫字母
^[]表示定位在行首
^[a-z]表示行首非小寫字母
^$表示空白行
g..d代表共4個字符隔披,開頭為g,結(jié)尾為d(.代表絕對有一個任意字符)
g.*g代表g開頭且g結(jié)尾的字符串
[0-9][0-9]*表示任意數(shù)字
go\{2,5\}g 表示g后面接2-5個o和一個g的字符串(因為{}在shell中有特殊意義寂拆,所以用\來跳脫奢米。這也是為什么??表格的大括號{}都寫成了\{\}
ls -l . | grep '^l'列出當前目錄下的鏈接文檔
(利用了鏈接文檔的一個特性,其標頭會是 lrwxrwxr)

再次提醒:正則表達式的 原字符*通配符* 不是一回事哦

  • 通配符中纠永,它代表0-無窮多個字符
  • 正則表達式中鬓长,它代表匹配0-無窮多個的前一個RE字符

2.延伸正則表達

一般來講,了解基礎(chǔ)型的正則表達式已經(jīng)能夠幫助我們解決很多問題了尝江。不過涉波,某些時刻為了要簡化整個指令操作,使用范圍更廣的延伸型正則表達會更加方便炭序。
eg:延伸型正則表達可以透過群組功能‘|’來進行一次搜尋啤覆,其中的管道符|意義為“或 or”。不過惭聂,grep預(yù)設(shè)僅支持基礎(chǔ)正則表達式窗声,如果要使用延伸型正則表達,可以使用grep -E 或者 egrep辜纲。我覺得后者使用起來更方便哦(不用來回切換大小寫~)

表達式 描述 范例
+ 匹配之前1個或多個 tx+t 匹配 txt 或 txxt/txxxt/...
笨觅? 匹配之前1個或沒有 te?xt 只能匹配 txt 或 text
| 用或的方式找出字符串 gd|god|good匹配gd,god,good
() 匹配括號中的字符串 bio(info)? 匹配 bio 或 bioinfo
()+ 多個重復群組的判別 A(xyz)+C 匹配AxyzC或AxyzxyzC等...
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市耕腾,隨后出現(xiàn)的幾起案子见剩,更是在濱河造成了極大的恐慌,老刑警劉巖扫俺,帶你破解...
    沈念sama閱讀 222,590評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件苍苞,死亡現(xiàn)場離奇詭異,居然都是意外死亡牵舵,警方通過查閱死者的電腦和手機柒啤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,157評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來畸颅,“玉大人担巩,你說我怎么就攤上這事∶怀矗” “怎么了涛癌?”我有些...
    開封第一講書人閱讀 169,301評論 0 362
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我拳话,道長先匪,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,078評論 1 300
  • 正文 為了忘掉前任弃衍,我火速辦了婚禮呀非,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘镜盯。我一直安慰自己岸裙,他們只是感情好,可當我...
    茶點故事閱讀 69,082評論 6 398
  • 文/花漫 我一把揭開白布速缆。 她就那樣靜靜地躺著降允,像睡著了一般。 火紅的嫁衣襯著肌膚如雪艺糜。 梳的紋絲不亂的頭發(fā)上剧董,一...
    開封第一講書人閱讀 52,682評論 1 312
  • 那天,我揣著相機與錄音破停,去河邊找鬼翅楼。 笑死,一個胖子當著我的面吹牛辱挥,可吹牛的內(nèi)容都是我干的犁嗅。 我是一名探鬼主播,決...
    沈念sama閱讀 41,155評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼晤碘,長吁一口氣:“原來是場噩夢啊……” “哼褂微!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起园爷,我...
    開封第一講書人閱讀 40,098評論 0 277
  • 序言:老撾萬榮一對情侶失蹤宠蚂,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后童社,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體求厕,經(jīng)...
    沈念sama閱讀 46,638評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,701評論 3 342
  • 正文 我和宋清朗相戀三年扰楼,在試婚紗的時候發(fā)現(xiàn)自己被綠了呀癣。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,852評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡弦赖,死狀恐怖项栏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蹬竖,我是刑警寧澤沼沈,帶...
    沈念sama閱讀 36,520評論 5 351
  • 正文 年R本政府宣布流酬,位于F島的核電站,受9級特大地震影響列另,放射性物質(zhì)發(fā)生泄漏芽腾。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,181評論 3 335
  • 文/蒙蒙 一页衙、第九天 我趴在偏房一處隱蔽的房頂上張望摊滔。 院中可真熱鬧,春花似錦拷姿、人聲如沸惭载。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,674評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽棒妨。三九已至,卻和暖如春券腔,著一層夾襖步出監(jiān)牢的瞬間伏穆,已是汗流浹背纷纫。 一陣腳步聲響...
    開封第一講書人閱讀 33,788評論 1 274
  • 我被黑心中介騙來泰國打工枕扫, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人辱魁。 一個月前我還...
    沈念sama閱讀 49,279評論 3 379
  • 正文 我出身青樓烟瞧,卻偏偏與公主長得像染簇,于是被迫代替她去往敵國和親参滴。 傳聞我的和親對象是個殘疾皇子锻弓,可洞房花燭夜當晚...
    茶點故事閱讀 45,851評論 2 361