值得讀的linux的正則表達(dá)式總結(jié)---1

在linux 的使用中欺旧，相同的正則表達(dá)式在不同的命令中所實(shí)現(xiàn)的匹配結(jié)果并完全相同姑丑，這就免不了導(dǎo)致我們?cè)谑褂脮r(shí)候的疑惑。要解決這個(gè)疑惑辞友，我們需要了解一些背景：

POSIX 是一個(gè)標(biāo)準(zhǔn)栅哀，其中定義了一些正則表達(dá)式的規(guī)范，而Linux基本上實(shí)現(xiàn)了POSIX的規(guī)范踏枣，但并沒有參加正式的POSIX認(rèn)證（這個(gè)說法查自百度的百科詞條POSIX)昌屉。而POSIX 定義了兩種正則表達(dá)式語法，一種是BRE(Basic Regex Expression)茵瀑，另一種是ERE(Extended Regex Expression).

關(guān)于基本正則表達(dá)式(BRE),其支持的基本用法有：

^    表示匹配行首
$    表示匹配行尾
.    表示匹配任意單個(gè)字符间驮，但是不含換行符‘\n’

[]   匹配區(qū)間的任意字符，區(qū)間中可以是一個(gè)到多個(gè)字符马昨，因?yàn)?并不是單一符號(hào)表示竞帽，所以需要用雙引號(hào) 引用起來.
[^]  區(qū)間任意字符都不匹配，因?yàn)椴皇菃我环?hào)表示鸿捧，所以要用 雙引號(hào) 引用起來. 同樣屹篓，區(qū)間中可以是一個(gè)到多個(gè)字符.
-    遞增的連續(xù)區(qū)間，從來不能單獨(dú)使用匙奴，常用在 [] 的內(nèi)部堆巧，比如 "[a-z]" 表示a到z中的任意字符."[^a-z]" 表示a-z都不能匹配，也就是a-z之外的字符匹配.

*    屬于二級(jí)正則表達(dá)式泼菌，因?yàn)槠浔硎厩懊嫫ヅ涑霈F(xiàn)的此處谍肤，此處表示匹配0次到多次.

\    這個(gè)表示轉(zhuǎn)義字符. 比如：echo "abcde\f" | grep  -o '\\'  的結(jié)果為: \

ERE作為擴(kuò)展正則表達(dá)式，其除了支持BRE哗伯，還支持如下的基本用法：

擴(kuò)展的regular expression, 主要是實(shí)現(xiàn)二級(jí)正則表達(dá)式荒揣，也就是對(duì)匹配次數(shù)進(jìn)行限制.
+  限制匹配的次數(shù)為1到多次.
?  限制匹配的次數(shù)為1次或者0次.
()  單一字符，可以直接跟限制次數(shù)的表達(dá)式焊刹，但是對(duì)于字符串系任，就需要用()引用起來，然后才能跟限制次數(shù)的表達(dá)式.
{n}   匹配前面的表達(dá)式n次
{n,}  匹配前面的表達(dá)式n次或者更多次.
{n,m} 匹配前面的表達(dá)式n次到m次.
|   相當(dāng)于邏輯或虐块，a|b  表示匹配a或者b.

關(guān)于上述擴(kuò)展以及基本正則表達(dá)式俩滥，參考https://man.linuxde.net/docs/shell_regex.html

知道了上述的基本和擴(kuò)展正則表達(dá)式，當(dāng)使用linux命令的時(shí)候贺奠，要查看幫助都支持什么正則表達(dá)式举农，比如： grep命令,其幫助文檔中有如下一段：

       -G, --basic-regexp
              Interpret PATTERN  as  a  basic  regular  expression  (BRE,  see
              below).  This is the default.

也就是說，默認(rèn)情況下敞嗡，grep 支持基本BRE正則表達(dá)式.

實(shí)際上颁糟，并不是所有的命令都完全兼容的支持 BRE與ERE航背，對(duì)于不同的命令，可能都有特殊的情況棱貌，比如：grep 就無法把 \t 識(shí)別為tab鍵對(duì)應(yīng)的值玖媚。對(duì)于grep的這個(gè)情況，有如下的多種解決方法：
a.
指定grep 使用perl的正則表達(dá)式婚脱，參數(shù)為： -P今魔， perl 正則是支持 "\t" 表示tab.
b.
使用 "^V<tab>" 來實(shí)現(xiàn)向grep 傳遞tab鍵的值, 其中引號(hào)里面的內(nèi)容并不是看到的輸入字符，而是以下操作的結(jié)果：按下ctrl+v, 然后按下tab建障贸。
這種方式有一個(gè)明顯的缺點(diǎn)：如果需要在shell腳本中實(shí)現(xiàn)grep 的話错森，顯然該方法并不具有很好的通用性.
c.
3.1.2.4 ANSI-C Quoting，通過這里描述的ANSI-C的Quoting的特性篮洁，我們可以用 $'\t' 來表示 tab 鍵的值. 個(gè)人的理解是： shell 對(duì)這個(gè) $'\t' 進(jìn)行了interpreted, 然后把結(jié)果傳遞給了grep 做進(jìn)一步的處理涩维，但是如果用在grep中的正則表達(dá)式比較復(fù)雜，而tab僅僅是其中一個(gè)字符袁波，那么用起來比較麻煩,另外瓦阐，并且不是所有的shell都支持對(duì)$'\t'的 interpreted. 所以通用性也不是很好.
d.
用printf 命令來輸出 tab 對(duì)應(yīng)的鍵值，然后傳遞給grep 進(jìn)行處理篷牌。具體的用法是：printf '\t' 睡蟋，這個(gè)命令的結(jié)果就是 tab鍵的值，可以傳遞給grep 使用枷颊。比如用： grep "$(printf '\t')" foo.txt 命令戳杀。如果是復(fù)雜的正則表達(dá)式，那么依然具有很好的兼容性夭苗。個(gè)人比較推薦.

在linux 的shell中豺瘤，對(duì)變量的訪問是用 $加上變量名稱來實(shí)現(xiàn)的，如果變量的值是多行的內(nèi)容（比如是一個(gè)文件的內(nèi)容）听诸，那么這時(shí)候?qū)ψ兞康脑L問就有兩種方式, 訪問變量時(shí)候是否用引號(hào)，對(duì)應(yīng)的結(jié)果是不一樣的蚕泽，如果使用了引號(hào)晌梨，那么是按行進(jìn)行處理的，如果沒有用引號(hào)须妻，那么是作為一個(gè)整體處理的仔蝌。

[root@test~]# str=`head /etc/os-release`
[root@test ~]# echo $str
NAME="Red Hat Enterprise Linux Workstation" VERSION="7.6 (Maipo)" ID="rhel" ID_LIKE="fedora" VARIANT="Workstation" VARIANT_ID="workstation" VERSION_ID="7.6" PRETTY_NAME="Red Hat Enterprise Linux Workstation 7.6 (Maipo)" ANSI_COLOR="0;31" CPE_NAME="cpe:/o:redhat:enterprise_linux:7.6:GA:workstation"
[root@test ~]# echo "$str"
NAME="Red Hat Enterprise Linux Workstation"
VERSION="7.6 (Maipo)"
ID="rhel"
ID_LIKE="fedora"
VARIANT="Workstation"
VARIANT_ID="workstation"
VERSION_ID="7.6"
PRETTY_NAME="Red Hat Enterprise Linux Workstation 7.6 (Maipo)"
ANSI_COLOR="0;31"
CPE_NAME="cpe:/o:redhat:enterprise_linux:7.6:GA:workstation"
[root@test ~]#

本文原創(chuàng)，轉(zhuǎn)載請(qǐng)著名出處

最后編輯于：2021.12.01 18:14:34

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末荒吏，一起剝皮案震驚了整個(gè)濱河市敛惊，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌绰更，老刑警劉巖瞧挤，帶你破解...
沈念sama閱讀 216,402評(píng)論 6贊 499
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件锡宋，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡特恬，警方通過查閱死者的電腦和手機(jī)执俩，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,377評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來癌刽，“玉大人役首，你說我怎么就攤上這事∠园荩” “怎么了衡奥？”我有些...
開封第一講書人閱讀 162,483評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長远荠。經(jīng)常有香客問我矮固，道長，這世上最難降的妖魔是什么矮台？我笑而不...
開封第一講書人閱讀 58,165評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任乏屯，我火速辦了婚禮，結(jié)果婚禮上瘦赫，老公的妹妹穿的比我還像新娘辰晕。我一直安慰自己，他們只是感情好确虱，可當(dāng)我...
茶點(diǎn)故事閱讀 67,176評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布含友。她就那樣靜靜地躺著，像睡著了一般校辩。火紅的嫁衣襯著肌膚如雪窘问。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,146評(píng)論 1贊 297
城市分裂傳說
那天宜咒，我揣著相機(jī)與錄音惠赫，去河邊找鬼。笑死故黑，一個(gè)胖子當(dāng)著我的面吹牛儿咱，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播场晶，決...
沈念sama閱讀 40,032評(píng)論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼混埠，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了钳宪？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,896評(píng)論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎吏颖，沒想到半個(gè)月后搔体，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,311評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡侦高，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,536評(píng)論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年嫉柴，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片奉呛。...
茶點(diǎn)故事閱讀 39,696評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡计螺，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出瞧壮，到底是詐尸還是另有隱情登馒，我是刑警寧澤，帶...
沈念sama閱讀 35,413評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布咆槽，位于F島的核電站陈轿，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏秦忿。R本人自食惡果不足惜麦射，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,008評(píng)論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望灯谣。院中可真熱鬧潜秋，春花似錦、人聲如沸胎许。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽辜窑。三九已至钩述，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間穆碎，已是汗流浹背牙勘。一陣腳步聲響...
開封第一講書人閱讀 32,815評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留所禀，地道東北人方面。一個(gè)月前我還...
沈念sama閱讀 47,698評(píng)論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長得像北秽，于是被迫代替她去往敵國和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子最筒，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,592評(píng)論 2贊 353

值得讀的linux的正則表達(dá)式總結(jié)---1

本文原創(chuàng)，轉(zhuǎn)載請(qǐng)著名出處

推薦閱讀更多精彩內(nèi)容