作為linux中最為常用的三大文本(awk所禀,sed,grep)處理工具之一,掌握好其用法是很有必要的割去。
首先談一下grep命令的常用格式為:grep [選項(xiàng)] ”模式“ [文件]
grep家族總共有三個(gè):grep脸爱,egrep遇汞,fgrep。
常用選項(xiàng):
字段 | 說明 |
---|---|
-E | 開啟擴(kuò)展(Extend)的正則表達(dá)式簿废。 |
-i | 忽略大小寫(ignore case)空入。 |
-v | 反過來(invert),只打印沒有匹配的族檬,而匹配的反而不打印歪赢。 |
-n | 顯示行號(hào) |
-w | 被匹配的文本只能是單詞,而不能是單詞中的某一部分单料,如文本中有l(wèi)iker埋凯,而我搜尋的只是like,就可以使用-w選項(xiàng)來避免匹配liker |
-c | 顯示總共有多少行被匹配到了扫尖,而不是顯示被匹配到的內(nèi)容白对,注意如果同時(shí)使用-cv選項(xiàng)是顯示有多少行沒有被匹配到。 |
-o | 只顯示被模式匹配到的字符串换怖。 |
--color | 將匹配到的內(nèi)容以顏色高亮顯示甩恼。 |
-A n | 顯示匹配到的字符串所在的行及其后n行,after |
-B n | 顯示匹配到的字符串所在的行及其前n行沉颂,before |
-C n | 顯示匹配到的字符串所在的行及其前后各n行条摸,context |
模式部分:
1、直接輸入要匹配的字符串兆览,這個(gè)可以用fgrep(fast grep)代替來提高查找速度屈溉,比如我要匹配一下hello.c文件中printf的個(gè)數(shù):grep -c "printf" hello.c
2、使用基本正則表達(dá)式抬探,下面談關(guān)于基本正則表達(dá)式的使用:
匹配字符:
字段 | 說明 |
---|---|
. | 任意一個(gè)字符子巾。 |
[abc] | 表示匹配一個(gè)字符,這個(gè)字符必須是abc中的一個(gè)小压。 |
[a-zA-Z] | 表示匹配一個(gè)字符线梗,這個(gè)字符必須是a-z或A-Z這52個(gè)字母中的一個(gè)。 |
[^123] | 匹配一個(gè)字符怠益,這個(gè)字符是除了1仪搔、2、3以外的所有字符蜻牢。 |
對(duì)于一些常用的字符集烤咧,系統(tǒng)做了定義:
[A-Za-z] 等價(jià)于 [[:alpha:]]
[0-9] 等價(jià)于 [[:digit:]]
[A-Za-z0-9] 等價(jià)于 [[:alnum:]]
tab,space 等空白字符 [[:space:]]
[A-Z] 等價(jià)于 [[:upper:]]
[a-z] 等價(jià)于 [[:lower:]]
標(biāo)點(diǎn)符號(hào) [[:punct:]]
匹配次數(shù):
字段 | 說明 |
---|---|
{m,n} | 匹配其前面出現(xiàn)的字符至少m次偏陪,至多n次。 |
? | 匹配其前面出現(xiàn)的內(nèi)容0次或1次煮嫌,等價(jià)于{0,1}笛谦。 |
* | 匹配其前面出現(xiàn)的內(nèi)容任意次,等價(jià)于{0,}昌阿,所以 ".*" 表述任意字符任意次饥脑,即無論什么內(nèi)容全部匹配。 |
位置錨定:
字段 | 說明 |
---|---|
^ | 錨定行首 |
$ | 錨定行尾懦冰。技巧:"^$"用于匹配空白行灶轰。 |
\b或< | 錨定單詞的詞首。如"\blike"不會(huì)匹配alike,但是會(huì)匹配liker |
\b或> | 錨定單詞的詞尾。如"\blike\b"不會(huì)匹配alike和liker捉捅,只會(huì)匹配like |
\B | 與\b作用相反。 |
分組及引用:
字段 | 說明 |
---|---|
(string) | 將string作為一個(gè)整體方便后面引用 |
\1 | 引用第1個(gè)左括號(hào)及其對(duì)應(yīng)的右括號(hào)所匹配的內(nèi)容椰弊。 |
\2 | 引用第2個(gè)左括號(hào)及其對(duì)應(yīng)的右括號(hào)所匹配的內(nèi)容。 |
\n | 引用第n個(gè)左括號(hào)及其對(duì)應(yīng)的右括號(hào)所匹配的內(nèi)容瓤鼻。 |
3秉版、擴(kuò)展的(Extend)正則表達(dá)式(注意要使用擴(kuò)展的正則表達(dá)式要加-E選項(xiàng),或者直接使用egrep):
匹配字符:這部分和基本正則表達(dá)式一樣
匹配次數(shù):
字段 | 說明 |
---|---|
* | 和基本正則表達(dá)式一樣 |
? | 基本正則表達(dá)式是?茬祷,二這里沒有\(zhòng)清焕。 |
{m,n} | 相比基本正則表達(dá)式也是沒有了\。 |
+ | 匹配其前面的字符至少一次祭犯,相當(dāng)于{1,}秸妥。 |
位置錨定:和基本正則表達(dá)式一樣。
分組及引用:
字段 | 說明 |
---|---|
(string) | 相比基本正則表達(dá)式也是沒有了\沃粗。 |
\1 | 引用部分和基本正則表達(dá)式一樣粥惧。 |
\n | 引用部分和基本正則表達(dá)式一樣。 |
或者:
字段 | 說明 |
---|---|
a|b | 匹配a或b最盅,注意a是指 | 的左邊的整體突雪,b也同理。比如 C|cat 表示的是 C或cat涡贱,而不是Cat或cat咏删,如果要表示Cat或cat,則應(yīng)該寫為 (C|c)at 问词。記住(string)除了用于引用還用于分組督函。 |
注1:默認(rèn)情況下,正則表達(dá)式的匹配工作在貪婪模式下,也就是說它會(huì)盡可能長(zhǎng)地去匹配辰狡,比如某一行有字符串 abacb锋叨,如果搜索內(nèi)容為 "a.b" 那么會(huì)直接匹配 abacb這個(gè)串,而不會(huì)*只匹配ab或acb搓译。
注2:所有的正則字符悲柱,如 [ 、* 些己、( 等,若要搜索 * 嘿般,而不是想把 * 解釋為重復(fù)先前字符任意次段标,可以使用 * 來轉(zhuǎn)義。
下面用一個(gè)練習(xí)來結(jié)束本次grep的學(xué)習(xí):
在網(wǎng)絡(luò)配置文件 /etc/sysconfig/network-scripts/ifcfg-ens33 中檢索出所有的 IP
1炉奴、檢索出 0-255的范圍
2逼庞、由0-255的數(shù)字組合成IP
3、簡(jiǎn)化