1 概述
通配符和正則表達(dá)式經(jīng)常會引起混亂,本文兩者之間的區(qū)別進(jìn)行比較熏挎。
通配符用于匹配文件名策橘,shell在做PathnameExpansion時用到的窗悯。通配符是由shell解析的,比如find梦皮,ls炭分,cp,mv等命令支持通配符查找文件名届氢。
正則表達(dá)式元字符有字符匹配欠窒、匹配次數(shù)、位置錨定退子、分組岖妄。主要是處理文本里的內(nèi)容,用來匹配文本里的字符串寂祥,針對文件內(nèi)容的文本過濾工具里荐虐,大都用到正則表達(dá)式,如grep,sed,awk,vim, less,nginx,varnish等命令支持正則表達(dá)式丸凭。
2 通配符
2.1 常用通配符
通配符是由shell處理的(不是由所涉及到命令語句處理的福扬,其實(shí)我們在shell各個命令中也沒有發(fā)現(xiàn)有這些通配符介紹), 它只會出現(xiàn)在命令的“參數(shù)”里(它不用在命令名稱里腕铸,也不用在操作符上)。當(dāng)shell在“參數(shù)”中遇到了通配符時铛碑,shell會將其當(dāng)作路徑或文件名去在磁盤上搜尋可能的匹配:若符合要求的匹配存在狠裹,則進(jìn)行替換(路徑擴(kuò)展);否則就將該通配符作為一個普通字符傳遞給“命令”汽烦,然后再由命令進(jìn)行處理涛菠。
總之,通配符實(shí)際上就是一種shell實(shí)現(xiàn)的路徑擴(kuò)展功能撇吞。在通配符被處理后, shell會先完成該命令的重組俗冻,然后再繼續(xù)處理重組后的命令,直至執(zhí)行該命令牍颈。
shell提供轉(zhuǎn)義符有三種轉(zhuǎn)義符號迄薄,單引號,雙引號煮岁,和反向斜杠讥蔽,讓通配符或者元字符變成普通字符,不需要使用特殊含義
需要說明的是:通配符看起來有點(diǎn)象正則表達(dá)式語句人乓,但是它與正則表達(dá)式不同的勤篮,不能相互混淆。把通配符理解為shell特殊代號字符就可色罚。
常用通配符碰缔,通配符的其他特殊字符,轉(zhuǎn)義字符如下表格
2.1 ?通配符例子
2.1.1 常用通配符例子
1戳护、顯示/var目錄下所有以l開頭金抡,以一個小寫字母結(jié)尾,且中間出現(xiàn)至少一位數(shù)字的文件或目錄
ll l*[[:digit:]]*[[:lower:]]
2腌且、顯示/etc目錄下以任意一位數(shù)字開頭梗肝,且以非數(shù)字結(jié)尾的文件或目錄
ll [[:digit:]]*[^[:digit:]]
ll [0-9]*[^0-9]
3、顯示/etc/目錄下以非字母開頭铺董,后面跟了一個字母及其它任意長度任意字符的文件或目錄
ll [^[:alpha:]][[:alpha:]]*
4巫击、顯示/etc/目錄下所有以rc開頭,并后面是0-6之間的數(shù)字精续,其它為任意字符的文件或目錄
ls -d rc[0-6]*
5坝锰、顯示/etc目錄下,所有以.d結(jié)尾的文件或目錄
ls -d *.d
6重付、顯示/etc目錄下顷级,所有.conf結(jié)尾,且以m,n,r,p開頭的文件或目錄
ls -ld [mnrp]*.conf 多了一個d 參數(shù)后就會只顯示文件夾确垫,不顯示文件夾里的信息
7弓颈、只顯示/root下的隱藏文件和目錄
ls -Ad .*
ls -d .*[[:alnum:]]
8帽芽、只顯示/etc下的非隱藏目錄
ls -F | grep '/$'
ls -l? | grep '^d'
2.1.2 單引號和雙引號
單引號、雙引號用于用戶把帶有空格的字符串賦值給變量事的分界符翔冀。
[root@localhost sh]# str="Today is Monday"
[root@localhost sh]# echo $str
Today is Monday
如果沒有單引號或雙引號导街,shell會把空格后的字符串解釋為命令。
[root@localhost sh]# str=Today is Monday
bash: is: command not found
單引號和雙引號的區(qū)別橘蜜。單引號告訴shell忽略所有特殊字符菊匿,而雙引號忽略大多數(shù),但不包括三個符號$(美元符號)计福、\(反斜杠)、`(反向單引號)徽职。
[root@localhost sh]# testvalue=100
[root@localhost sh]# echo 'The testvalue is $testvalue'
The testvalue is $testvalue
[root@localhost sh]# echo "The testvalue is $testvalue"
The testvalue is 100
2.1.3 反向單引號
這里再說一下反向單引號象颖,再鍵盤左上角,和波浪號一起的符號姆钉。
在Linux中起著命令替換的作用说订,命令替換是指shell能夠?qū)⒁粋€命令的標(biāo)準(zhǔn)輸出插在一個命令行中任何位置。
如下潮瓶,shell會執(zhí)行反引號中的date命令陶冷,把結(jié)果插入到echo命令顯示的內(nèi)容中。
[root@localhost sh]# echo The date is `date`
The date is 2011年 03月 14日 星期一 21:15:43 CST
3 正則表達(dá)式
3.1 常用正則表達(dá)式
grep (global search regular expression(RE) and print out the line,全面搜索正則表達(dá)式并把行打印出來)是一種強(qiáng)大的文本搜索工具毯辅,它能使用正則表達(dá)式搜索文本埂伦,并把匹配的行打印出來。Unix的grep家族包括grep思恐、egrep和fgrep沾谜。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的擴(kuò)展胀莹,支持更多的re元字符基跑, fgrep就是fixed grep或fast grep,它們把所有的字母都看作單詞描焰,也就是說媳否,正則表達(dá)式中的元字符表示回其自身的字面意義,不再特殊荆秦。linux使用GNU版本的grep篱竭。它功能更強(qiáng),可以通過-G萄凤、-E室抽、-F命令行選項(xiàng)來使用egrep和fgrep的功能。
grep的工作方式是這樣的靡努,它在一個或多個文件中搜索字符串模板坪圾。如果模板包括空格晓折,則必須被引用,模板后的所有字符串被看作文件名兽泄。搜索的結(jié)果被送到屏幕漓概,不影響原文件內(nèi)容。
grep可用于shell腳本病梢,因?yàn)間rep通過返回一個狀態(tài)值來說明搜索的狀態(tài)胃珍,如果模板搜索成功,則返回0蜓陌,如果搜索不成功觅彰,則返回1,如果搜索的文件不存在钮热,則返回2填抬。我們利用這些返回值就可進(jìn)行一些自動化的文本處理工作。
3.2 例子
1隧期、顯示三個用戶root飒责、sunny、tom的UID和默認(rèn)shell
grep "^root\>\|^sunny\>\|^tom\>" /etc/passwd | cut -d: -f3,7
grep -E "^root\>|^sunny\>|^tom\>" /etc/passwd
grep -E "^(root|sunny|tom)\>" /etc/passwd | cut -d : -f3,7
2仆潮、找出/etc/rc.d/init.d/functions文件中行首為某單詞(包括下劃線)后面跟一個小括號
grep -oE "^[[:alnum:]_]+\(\)" /etc/rc.d/init.d/functions
3宏蛉、使用egrep取出/etc/rc.d/init.d/functions中其基名
echo /etc/rc.d/init.d/functions | grep -oE "[^/]+/?$"
非/開頭,最后是/可有可無性置,然后結(jié)尾拾并,這個肯定是最后一個字段才是這樣的情況
4、使用egrep取出上面路徑的目錄名
echo /etc/rc.d/init.d/functions/ | grep -oE "^/.*/\<"
這道題不太清楚蚌讼,最后一個位置錨定辟灰,/開頭,/<這個是位置錨定篡石,用/最后的位置錨定
5芥喇、統(tǒng)計last命令中以root登錄的每個主機(jī)IP地址登錄次數(shù)
last | grep ^root | grep -oE "([0-9]{1,3}.){3}[0-9]{1,3}"|sort| uniq -c|sort -nr
6、利用擴(kuò)展正則表達(dá)式分別表示0-9凰萨、10-99继控、100-199、200-249胖眷、250-255
echo {0..255} | grep -oE "\<[0-9]\>" |tr "\n" " "直接截取出對應(yīng)數(shù)字在換成一行
echo {0..255} | grep -oE "\<[1-9][0-9]\>"
echo {0..255} | grep -oE "\<1[0-9]{2}\>"詞尾不錨定也可以
echo {0..255} | grep -oE "\<2[0-4][0-9]\>"
echo {0..255} | grep -oE "\<25[0-5]\>"
7武通、截取出ipv4地址
ifconfig | grep -oE "\<(([0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>"
8、顯示ifconfig命令結(jié)果中所有IPv4地址
ifconfig | grep -oE "\<([0-9]{1,3}\.){3}[0-9]{1,3}"
以下這個語句可以精確到每個位的范圍
ifconfig | grep -oE "\<(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>"
注意這里的點(diǎn)號要加反斜杠進(jìn)行轉(zhuǎn)義珊搀。
9冶忱、將此字符串:welcome to magedu linux 中的每個字符去重并排序,重復(fù)次數(shù)多的排到前面
echo "welcome to magedu linux" | grep -oE [[:print:]]|sort|uniq -c|sort -r
4 區(qū)別對比
需要明確的是境析,通配符是用來匹配文件名囚枪,進(jìn)行文件名的查找派诬,而正則表達(dá)式是用來匹配文件里內(nèi)容的,我們常用的grep命令链沼,交給管道符之后使用grep已經(jīng)不是匹配文件名了,這是對文件的操作默赂,并不是匹配文件名。
不同點(diǎn)
相同點(diǎn)