Grep

Linux文本處理三劍客

grep：文本過濾(模式：pattern)工具
grep, egrep, fgrep（不支持正則表達(dá)式搜索）
sed：stream editor畅蹂，文本編輯工具
awk：Linux上的實(shí)現(xiàn)gawk，文本報(bào)告生成器

grep

grep: Global search REgularexpression and Print out the line（全局搜索正則表達(dá)式苛让，列出行）
作用：文本搜索工具，根據(jù)用戶指定的“模式”對目標(biāo)文本逐行進(jìn)行匹配檢查湿诊；打印匹配到的行
模式：由正則表達(dá)式字符及文本字符所編寫的過濾條件

grep [OPTIONS] PATTERN [FILE...]

grep root /etc/passwd
grep "$USER" /etc/passwd
grep '$USER' /etc/passwd
grep `whoami` /etc/passwd

grep命令選項(xiàng)

--color=auto: 對匹配到的文本著色顯示
-v: 顯示不被pattern匹配到的行
-i: 忽略字符大小寫
-n：顯示匹配的行號
-c: 統(tǒng)計(jì)匹配的行數(shù)
-o: 僅顯示匹配到的字符串
-q: 靜默模式狱杰，不輸出任何信息
-A #: after, 后#行
-B #: before, 前#行
-C #：context, 前后各#行
-e：實(shí)現(xiàn)多個(gè)選項(xiàng)間的邏輯or關(guān)系
     grep –e ‘cat ’ -e ‘dog’ file
-w：匹配整個(gè)單詞
-E：使用ERE
-F：相當(dāng)于fgrep，不支持正則表達(dá)式

Paste_Image.png

-q 靜默模式找到?jīng)]找到都不顯示

echo $? 為0表示找到了
echo $? 為1表示沒找到

Paste_Image.png

-w 匹配整個(gè)單詞（漢字字母數(shù)字下劃線算一個(gè)單詞內(nèi)部）

Paste_Image.png

正則表達(dá)式

正則表達(dá)式用來處理的不是文件的名稱厅须，而是匹配文件的內(nèi)容或字符串
REGEXP：由一類特殊字符及文本字符所編寫的模式仿畸，其中有些字符（元字符）不表示字符字面意義，而表示控制或通配的功能

程序支持：grep,sed,awk,vim, less,nginx,varnish等

分兩類：

  基本正則表達(dá)式：BRE
  擴(kuò)展正則表達(dá)式：ERE
         grep -E, egrep

正則表達(dá)式引擎：

采用不同算法，檢查處理正則表達(dá)式的軟件模塊
PCRE（Perl Compatible Regular Expressions）

元字符分類：字符匹配错沽、匹配次數(shù)簿晓、位置錨定、分組

man 7 regex
fgrep = grep -F 不支持正則表達(dá)式

基本正則表達(dá)式元字符

字符匹配:

.  匹配任意單個(gè)字符
 []  匹配指定范圍內(nèi)的任意單個(gè)字符
[^] 匹配指定范圍外的任意單個(gè)字符
[:alnum:] 字母和數(shù)字
[:alpha:] 代表任何英文大小寫字符千埃，亦即A-Z, a-z
[:lower:] 小寫字母     [:upper:] 大寫字母
[:blank:] 空白字符（空格和制表符）
[:space:]水平和垂直的空白字符（比[:blank:]包含的范圍廣）
[:cntrl:] 不可打印的控制字符（退格憔儿、刪除、警鈴...）
[:digit:] 十進(jìn)制數(shù)字[:xdigit:]十六進(jìn)制數(shù)字
[:graph:] 可打印的非空白字符
[:print:] 可打印字符
[:punct:] 標(biāo)點(diǎn)符號

Paste_Image.png

匹配次數(shù)

用在要指定次數(shù)的字符后面放可，用于指定前面的字符要出現(xiàn)的次數(shù)

* 匹配前面的字符任意次谒臼，包括0次
      貪婪式：盡可能長的匹配
.*任意長的任意字符
\?匹配其前面的字符0或1次
\+匹配其前面的字符至少1次
\{n\}匹配前面的字符n次
\{m,n\}匹配前面的字符至少m次，至多n次
\{,n\}匹配前面的字符至多n次
\{n,\}匹配前面的字符至少n次

Paste_Image.png

位置錨定

定位出現(xiàn)的位置

^ 行首錨定耀里，用于模式的最左側(cè)
$ 行尾錨定蜈缤，用于模式的最右側(cè)
^PATTERN$ 用于模式匹配整行
    ^$ 空行（回車導(dǎo)致的空行）
    ^[[:space:]]*$ 空白行（空格、Tab鍵冯挎、空行）
\< 或\b詞首錨定底哥，用于單詞模式的左側(cè)
\> 或\b詞尾錨定；用于單詞模式的右側(cè)
\<PATTERN\>匹配整個(gè)單詞

Paste_Image.png

單詞邊界：除了漢字字母數(shù)字下劃線其余的都可以作為單詞邊界

Paste_Image.png

分組

\ ( \ ) 將一個(gè)或多個(gè)字符捆綁在一起房官，當(dāng)作一個(gè)整體進(jìn)行處理趾徽，如：\ (root \ ) +
分組括號中的模式匹配到的內(nèi)容會(huì)被正則表達(dá)式引擎記錄于內(nèi)部的變量中，這些變量的命名方式為: \1, \2, \3, ...
\1表示從左側(cè)起第一個(gè)左括號以及與之匹配右括號之間的模式所匹配到的字符
示例：\ (string1 \ + \ (string2 \ )\ )
\1 ：string1 \ + \ (string2 \ )
\2 ：string2
后向引用：引用前面的分組括號中的模式所匹配字符易阳，而非模式本身
或者：|
示例：a|b: a或b C|cat: C或cat (C|c)at:Cat或cat

Paste_Image.png

egrep及擴(kuò)展的正則表達(dá)式

egrep= grep -E
egrep[OPTIONS] PATTERN [FILE...]
擴(kuò)展正則表達(dá)式的元字符：

字符匹配:

. 任意單個(gè)字符
[] 指定范圍的字符
[^] 不在指定范圍的字符

次數(shù)匹配：

*：匹配前面字符任意次
?: 0或1次
+：1次或多次
{m}：匹配m次
{m,n}：至少m附较，至多n次

Paste_Image.png

位置錨定：

^ :行首
$ :行尾
\<, \b :語首
\>, \b :語尾

分組：

()
后向引用：\1, \2, ...

或者：

a|b: a或b
C|cat: C或cat
(C|c)at:Cat或cat

最后編輯于：2017.12.08 01:05:51

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末吃粒，一起剝皮案震驚了整個(gè)濱河市潦俺，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌徐勃，老刑警劉巖事示，帶你破解...
沈念sama閱讀 216,997評論 6贊 502
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異僻肖，居然都是意外死亡肖爵，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,603評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門臀脏，熙熙樓的掌柜王于貴愁眉苦臉地迎上來劝堪，“玉大人，你說我怎么就攤上這事揉稚∶肜玻” “怎么了？”我有些...
開封第一講書人閱讀 163,359評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵搀玖，是天一觀的道長余境。經(jīng)常有香客問我，道長，這世上最難降的妖魔是什么芳来？我笑而不...
開封第一講書人閱讀 58,309評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任含末，我火速辦了婚禮，結(jié)果婚禮上即舌，老公的妹妹穿的比我還像新娘佣盒。我一直安慰自己，他們只是感情好侥涵，可當(dāng)我...
茶點(diǎn)故事閱讀 67,346評論 6贊 390
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布沼撕。她就那樣靜靜地躺著，像睡著了一般芜飘。火紅的嫁衣襯著肌膚如雪务豺。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,258評論 1贊 300
城市分裂傳說
那天嗦明，我揣著相機(jī)與錄音笼沥，去河邊找鬼。笑死娶牌，一個(gè)胖子當(dāng)著我的面吹牛奔浅，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播诗良，決...
沈念sama閱讀 40,122評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼汹桦，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了鉴裹？” 一聲冷哼從身側(cè)響起舞骆，我...
開封第一講書人閱讀 38,970評論 0贊 275
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎径荔，沒想到半個(gè)月后督禽，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,403評論 1贊 313
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡总处，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,596評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年狈惫，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鹦马。...
茶點(diǎn)故事閱讀 39,769評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡胧谈，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出荸频，到底是詐尸還是另有隱情菱肖，我是刑警寧澤，帶...
沈念sama閱讀 35,464評論 5贊 344
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布试溯，位于F島的核電站蔑滓，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜键袱，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,075評論 3贊 327
男人毒藥：我在死后第九天來索命
文/蒙蒙一燎窘、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧蹄咖，春花似錦褐健、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,705評論 0贊 22
一樁弒父案蚜迅，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至俊抵，卻和暖如春谁不，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背徽诲。一陣腳步聲響...
開封第一講書人閱讀 32,848評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工刹帕，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人谎替。一個(gè)月前我還...
沈念sama閱讀 47,831評論 2贊 370
代替公主和親
正文我出身青樓偷溺，卻偏偏與公主長得像，于是被迫代替她去往敵國和親钱贯。傳聞我的和親對象是個(gè)殘疾皇子挫掏，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,678評論 2贊 354

Grep

Linux文本處理三劍客

grep

正則表達(dá)式

基本正則表達(dá)式元字符

字符匹配:

匹配次數(shù)

位置錨定

分組

egrep及擴(kuò)展的正則表達(dá)式

推薦閱讀更多精彩內(nèi)容