值得讀的linux的正則表達(dá)式總結(jié)---1

在linux 的使用中欺旧,相同的正則表達(dá)式在不同的命令中所實(shí)現(xiàn)的匹配結(jié)果并完全相同姑丑,這就免不了導(dǎo)致我們?cè)谑褂脮r(shí)候的疑惑。要解決這個(gè)疑惑辞友,我們需要了解一些背景:

POSIX 是一個(gè)標(biāo)準(zhǔn)栅哀,其中定義了一些正則表達(dá)式的規(guī)范,而Linux基本上實(shí)現(xiàn)了POSIX的規(guī)范踏枣,但并沒有參加正式的POSIX認(rèn)證(這個(gè)說法查自百度的百科詞條POSIX)昌屉。 而POSIX 定義了兩種正則表達(dá)式語法,一種是BRE(Basic Regex Expression)茵瀑,另一種是ERE(Extended Regex Expression).

關(guān)于基本正則表達(dá)式(BRE),其支持的基本用法有:

^    表示匹配行首
$    表示匹配行尾
.    表示匹配任意單個(gè)字符间驮,但是不含換行符‘\n’

[]   匹配區(qū)間的任意字符,區(qū)間中可以是一個(gè)到多個(gè)字符马昨,因?yàn)?并不是單一符號(hào)表示竞帽,所以需要用雙引號(hào) 引用起來.
[^]  區(qū)間任意字符都不匹配,因?yàn)椴皇菃我环?hào)表示鸿捧,所以要用 雙引號(hào) 引用起來. 同樣屹篓,區(qū)間中可以是一個(gè)到多個(gè)字符.
-    遞增的連續(xù)區(qū)間,從來不能單獨(dú)使用匙奴,常用在 [] 的內(nèi)部堆巧,比如 "[a-z]" 表示a到z中的任意字符."[^a-z]" 表示a-z都不能匹配,也就是a-z之外的字符匹配.

*    屬于二級(jí)正則表達(dá)式泼菌,因?yàn)槠浔硎厩懊嫫ヅ涑霈F(xiàn)的此處谍肤,此處表示匹配0次到多次.

\    這個(gè)表示轉(zhuǎn)義字符. 比如:echo "abcde\f" | grep  -o '\\'  的結(jié)果為: \

ERE作為擴(kuò)展正則表達(dá)式,其除了支持BRE哗伯,還支持如下的基本用法:

擴(kuò)展的regular expression, 主要是實(shí)現(xiàn)二級(jí)正則表達(dá)式荒揣,也就是對(duì)匹配次數(shù)進(jìn)行限制.
+  限制匹配的次數(shù)為1到多次.
?  限制匹配的次數(shù)為1次或者0次.
()  單一字符,可以直接跟限制次數(shù)的表達(dá)式焊刹,但是對(duì)于字符串系任,就需要用()引用起來,然后才能跟限制次數(shù)的表達(dá)式.
{n}   匹配前面的表達(dá)式n次
{n,}  匹配前面的表達(dá)式n次或者更多次.
{n,m} 匹配前面的表達(dá)式n次到m次.
|   相當(dāng)于邏輯或虐块,a|b  表示匹配a或者b.

關(guān)于上述擴(kuò)展以及基本正則表達(dá)式俩滥,參考https://man.linuxde.net/docs/shell_regex.html

知道了上述的基本和擴(kuò)展正則表達(dá)式,當(dāng)使用linux命令的時(shí)候贺奠,要查看幫助都支持什么正則表達(dá)式举农,比如: grep命令,其幫助文檔中有如下一段:

       -G, --basic-regexp
              Interpret PATTERN  as  a  basic  regular  expression  (BRE,  see
              below).  This is the default.

也就是說,默認(rèn)情況下敞嗡,grep 支持基本BRE正則表達(dá)式.

實(shí)際上颁糟,并不是所有的命令都完全兼容的支持 BRE與ERE航背, 對(duì)于不同的命令,可能都有特殊的情況棱貌,比如:grep 就無法把 \t 識(shí)別為tab鍵對(duì)應(yīng)的值玖媚。對(duì)于grep的這個(gè)情況,有如下的多種解決方法:
a.
指定grep 使用perl的正則表達(dá)式婚脱,參數(shù)為: -P今魔, perl 正則是支持 "\t" 表示tab.
b.
使用 "^V<tab>" 來實(shí)現(xiàn)向grep 傳遞tab鍵的值, 其中引號(hào)里面的內(nèi)容并不是看到的輸入字符,而是以下操作的結(jié)果: 按下ctrl+v, 然后按下tab建障贸。
這種方式有一個(gè)明顯的缺點(diǎn): 如果需要在shell腳本中實(shí)現(xiàn)grep 的話错森,顯然該方法并不具有很好的通用性.
c.
3.1.2.4 ANSI-C Quoting,通過這里描述的ANSI-C的Quoting的特性篮洁,我們可以用 $'\t' 來表示 tab 鍵的值. 個(gè)人的理解是: shell 對(duì)這個(gè) $'\t' 進(jìn)行了interpreted, 然后把結(jié)果傳遞給了grep 做進(jìn)一步的處理涩维,但是如果用在grep中的正則表達(dá)式比較復(fù)雜,而tab僅僅是其中一個(gè)字符袁波,那么用起來比較麻煩,另外瓦阐,并且不是所有的shell都支持對(duì)$'\t'的 interpreted. 所以通用性也不是很好.
d.
用printf 命令來輸出 tab 對(duì)應(yīng)的鍵值,然后傳遞給grep 進(jìn)行處理篷牌。具體的用法是 :printf '\t' 睡蟋,這個(gè)命令的結(jié)果就是 tab鍵的值,可以傳遞給grep 使用枷颊。比如用: grep "$(printf '\t')" foo.txt 命令戳杀。 如果是復(fù)雜的正則表達(dá)式,那么依然具有很好的兼容性夭苗。個(gè)人比較推薦.

在linux 的shell中豺瘤,對(duì)變量的訪問是用 $加上變量名稱來實(shí)現(xiàn)的,如果變量的值是多行的內(nèi)容(比如是一個(gè)文件的內(nèi)容)听诸,那么這時(shí)候?qū)ψ兞康脑L問就有兩種方式, 訪問變量時(shí)候是否用引號(hào),對(duì)應(yīng)的結(jié)果是不一樣的蚕泽,如果使用了引號(hào)晌梨,那么是按行進(jìn)行處理的,如果沒有用引號(hào)须妻,那么是作為一個(gè)整體處理的仔蝌。

[root@test~]# str=`head /etc/os-release`
[root@test ~]# echo $str
NAME="Red Hat Enterprise Linux Workstation" VERSION="7.6 (Maipo)" ID="rhel" ID_LIKE="fedora" VARIANT="Workstation" VARIANT_ID="workstation" VERSION_ID="7.6" PRETTY_NAME="Red Hat Enterprise Linux Workstation 7.6 (Maipo)" ANSI_COLOR="0;31" CPE_NAME="cpe:/o:redhat:enterprise_linux:7.6:GA:workstation"
[root@test ~]# echo "$str"
NAME="Red Hat Enterprise Linux Workstation"
VERSION="7.6 (Maipo)"
ID="rhel"
ID_LIKE="fedora"
VARIANT="Workstation"
VARIANT_ID="workstation"
VERSION_ID="7.6"
PRETTY_NAME="Red Hat Enterprise Linux Workstation 7.6 (Maipo)"
ANSI_COLOR="0;31"
CPE_NAME="cpe:/o:redhat:enterprise_linux:7.6:GA:workstation"
[root@test ~]# 

本文原創(chuàng),轉(zhuǎn)載請(qǐng)著名出處

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末荒吏,一起剝皮案震驚了整個(gè)濱河市敛惊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌绰更,老刑警劉巖瞧挤,帶你破解...
    沈念sama閱讀 216,402評(píng)論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件锡宋,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡特恬,警方通過查閱死者的電腦和手機(jī)执俩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來癌刽,“玉大人役首,你說我怎么就攤上這事∠园荩” “怎么了衡奥?”我有些...
    開封第一講書人閱讀 162,483評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長远荠。 經(jīng)常有香客問我矮固,道長,這世上最難降的妖魔是什么矮台? 我笑而不...
    開封第一講書人閱讀 58,165評(píng)論 1 292
  • 正文 為了忘掉前任乏屯,我火速辦了婚禮,結(jié)果婚禮上瘦赫,老公的妹妹穿的比我還像新娘辰晕。我一直安慰自己,他們只是感情好确虱,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評(píng)論 6 388
  • 文/花漫 我一把揭開白布含友。 她就那樣靜靜地躺著,像睡著了一般校辩。 火紅的嫁衣襯著肌膚如雪窘问。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,146評(píng)論 1 297
  • 那天宜咒,我揣著相機(jī)與錄音惠赫,去河邊找鬼。 笑死故黑,一個(gè)胖子當(dāng)著我的面吹牛儿咱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播场晶,決...
    沈念sama閱讀 40,032評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼混埠,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了钳宪?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,896評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎吏颖,沒想到半個(gè)月后搔体,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,311評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡侦高,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評(píng)論 2 332
  • 正文 我和宋清朗相戀三年嫉柴,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片奉呛。...
    茶點(diǎn)故事閱讀 39,696評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡计螺,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出瞧壮,到底是詐尸還是另有隱情登馒,我是刑警寧澤,帶...
    沈念sama閱讀 35,413評(píng)論 5 343
  • 正文 年R本政府宣布咆槽,位于F島的核電站陈轿,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏秦忿。R本人自食惡果不足惜麦射,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評(píng)論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望灯谣。 院中可真熱鬧潜秋,春花似錦、人聲如沸胎许。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽辜窑。三九已至钩述,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間穆碎,已是汗流浹背牙勘。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評(píng)論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留所禀,地道東北人方面。 一個(gè)月前我還...
    沈念sama閱讀 47,698評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像北秽,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子最筒,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容