在Unix下一次性操作多個(gè)文件時(shí)羔挡,命令行提供通配符(wildcards)间唉,短文本模式(通常只有一個(gè)字符)利术,可以與文件路徑中的另一個(gè)字符(或多個(gè)字符)匹配,這種快捷方式使得可用簡(jiǎn)潔的模式來代表一組文件或者指定一整套相關(guān)的文件路徑名印叁。
使用通配符模式,您可以使用單個(gè)命令輕松地列出昨悼、查看、復(fù)制率触、移動(dòng)或刪除大量文件汇竭。通配符比正則表達(dá)式早出現(xiàn)葱蝗,可以看作是原始的正則表達(dá)式,功能沒有正則強(qiáng)大靈活细燎,但勝在簡(jiǎn)單和方便两曼。
下面介紹Unix中Bash的各種通配符。
? 字符
?字符代表單個(gè)字符玻驻。
# 存在文件 1.txt 2.txt 和 13.txt
$ ls ?.txt
1.txt 2.txt
上面命令中悼凑,?表示單個(gè)字符,所以會(huì)同時(shí)匹配1.txt和2.txt璧瞬。如果匹配多個(gè)字符佛析,就需要多個(gè)?連用。
# 存在文件 1.txt彪蓬、2.txt 和 13.txt
$ ls ??.txt
13.txt
上面命令中寸莫,??
表明匹配兩個(gè)字符。注意膘茎,?
不能匹配空字符桃纯,也就是說,它占據(jù)的位置必須有字符存在披坏。
* 字符
*
可以代表任意數(shù)量的字符态坦。
# 存在文件 1.txt、2.txt 和 13.txt
$ ls *.txt
1.txt 2.txt 13.txt
# 輸出所有文件
$ ls *
1.txt 2.txt 13.txt
上面代碼中棒拂,*
可以匹配任意長(zhǎng)度的字符伞梯,另外*
也可以匹配空字符。
# 存在文件 1.txt帚屉、2.txt 和 13.txt
$ ls 1*.txt
1.txt 13.txt
[...] 模式
[...]
表示匹配方括號(hào)之中的任意一個(gè)字符谜诫,比如[13679]
可以匹配五個(gè)數(shù)字,或者[aeiou]可以匹配五個(gè)元音字母攻旦。
# 存在文件 1.txt 2.txt 12.txt 和 13.txt
# 存在文件 a.txt e.txt u.txt 和 ae.txt
$ ls [12].txt
1.txt 2.txt
$ ls [ae].txt
a.txt e.txt
$ ls *[12].txt
12.txt 1.txt 2.txt
$ ls *[ae].txt
a.txt ae.txt e.txt
[start-end]
表示一個(gè)連續(xù)的范圍喻旷,[0-9]代表0-9這10個(gè)數(shù)字,[a-z]代表a-z這26個(gè)字母牢屋。
# 存在文件 a.txt e.txt u.txt 和 ae.txt
$ ls [a-z].txt
a.txt c.txt u.txt
# 存在文件 report1.txt且预、report2.txt、report3.txt 和 report13.txt
$ ls report[0-9].txt
report1.txt report2.txt report3.txt
[^...]
和 [!...]
[^...]
和[!...]
表示匹配不在方括號(hào)里面的字符(注意不包括空字符)烙无,這里兩種寫法是等同的锋谐。
# 存在文件 1.txt 2.txt 3.txt 和 13.txt
$ ls [^1].txt
2.txt 3.txt
$ ls [!1].txt
2.txt 3.txt
上面代碼中,[!1]
和 [^1]
表示要排除文件名中包含1的名字截酷。
這種模式下也可以使用連續(xù)范圍的寫法[!start-end]
和 [^start-end]
涮拗。
# 存在文件 report1.txt report2.txt report3.txt report4.txt report5.txt 和 report13.txt
$ echo report[!1-3].txt
report4.txt report5.txt
$ echo report[^1-3].txt
report4.txt report5.txt
上面代碼中,[!1-3]
和 [^1-3]
表示要排除文件名中包含1合搅、2和3的名字多搀。
{...} 模式
{...}
表示可以匹配大括號(hào)里面的所有模式,多個(gè)模式之間可以使用逗號(hào)分隔用于匹配灾部。
# 存在文件 dag deg dig dug dog ddg 和 dgg康铭,不存在 dtg
$ echo d{a,e,i,u,o,t}g
dag deg dig dug dog dtg
$ ls d{a,e,i,u,o,t}g
ls: cannot access dtg: No such file or directory
dag deg dig dog dug
這個(gè)模式也可以用于多字符的模式。
# 存在文件 cat dog pig赌髓,不存在tiger
$ echo {cat,dog,pig,tiger}
cat dog pig tiger
$ ls {cat,dog,pig,tiger}
ls: cannot access tiger: No such file or directory
cat dog pig
請(qǐng)注意从藤,當(dāng)使用echo
的命令的時(shí)候,{...}
與[...]
有一個(gè)很重要的區(qū)別锁蠕。如果匹配的文件不存在夷野,[...]
會(huì)失去模式的功能,變成一個(gè)單純的字符串荣倾,而{...}
依然可以展開悯搔。但是如果使用ls
的命令時(shí),結(jié)果如下:
# 不存在 a.txt 和 b.txt
$ ls [ab].txt
ls: cannot access [ab].txt: No such file or directory
$ echo [ab].txt
[ab].txt
$ ls {a,b}.txt
ls: cannot access a.txt: No such file or directory
ls: cannot access b.txt: No such file or directory
$ echo {a,b}.txt
a.txt b.txt
上面代碼中舌仍,如果不存在a.txt
和b.txt
妒貌,那么[ab].txt
就會(huì)變成一個(gè)普通的文件名通危,而{a,b}.txt
可以照樣展開。
另外灌曙,改模式下的大括號(hào)可以嵌套菊碟。
$ echo {j{p,p{a,e}}g,p{n,m}g,bmp}
jpg jpag jpeg png pmg bmp
與此同時(shí),大括號(hào)也可以與其他模式聯(lián)用在刺。
# 存在文件 cat dag deg dig dug dog dtg
$ echo {cat,d*}
cat dag deg dig dog dtg dug
# 不存在文件 cat dag deg dig dug dog dtg
$ echo {cat*,d*}
cat* d*
# 存在文件 cat逆害,不存在dag deg dig dug dog dtg
$ echo {cat*,d*}
cat d*
上面代碼中,會(huì)先進(jìn)行大括號(hào)擴(kuò)展蚣驼,然后進(jìn)行*
擴(kuò)展魄幕。擴(kuò)展時(shí),會(huì)先進(jìn)行判斷文件是否存在隙姿,當(dāng)文件不存在的情況下梅垄,會(huì)變成字符輸出厂捞。
{start..end} 模式
{start..end}
會(huì)匹配指定的連續(xù)范圍的字符输玷。
$ echo d{a..f}g
dag dbg dcg ddg deg dfg
$ echo {0..12}
0 1 2 3 4 5 6 7 8 9 10 11 12
如果遇到無法解釋的擴(kuò)展,模式會(huì)原樣輸出靡馁。
$ echo d{a1..a12}g d{a1..f12}g
d{a1..a12}g d{a1..f12}g
當(dāng)這種模式與逗號(hào)一起使用欲鹏,就可以寫出復(fù)雜的模式。
$ echo .{mp{3..4},m{4..5}{a,b,p,v}}
.mp3 .mp4 .m4a .m4b .m4p .m4v .m5a .m5b .m5p .m5v
注意事項(xiàng)
1臭墨、任何通配符都是先解釋(或者說是擴(kuò)展)赔嚎,再執(zhí)行命令;
# 存在文件 1.txt胧弛、2.txt 和 13.txt
$ ls 1*.txt
1.txt 13.txt
此處是先將1*.txt
擴(kuò)展成1.txt
和13.txt
尤误,然后執(zhí)行命令ls 1.txt 13.txt
。
這是因?yàn)锽ash 接收到命令以后结缚,當(dāng)發(fā)現(xiàn)命令中包含有通配符時(shí)损晤,會(huì)首先進(jìn)行通配符擴(kuò)展,然后再執(zhí)行命令红竭。
2尤勋、書寫的通配符不匹配時(shí),會(huì)當(dāng)成字符串原樣輸出茵宪;
# 不存在 ac 開頭的文件名
$ echo ac*
ac*
$ ls ac*.txt
ls: cannot access ac*.txt: No such file or directory
這里的原因時(shí)Bash 在擴(kuò)展通配符的時(shí)候最冰,當(dāng)發(fā)現(xiàn)不存在匹配的文件,會(huì)將通配符原樣輸出稀火。
但是對(duì)于echo
的命令時(shí)暖哨,{...}
不適用這個(gè)規(guī)則。
3凰狞、通配符的使用只適用于單層路徑篇裁;
上述的所有通配符都只能匹配單層文件路徑箕慧,不能跨目錄進(jìn)行文件匹配,也可以認(rèn)為通配符無法匹配子目錄里面的文件茴恰。這是因?yàn)?code>?或*
這樣的通配符颠焦,不能匹配路徑分隔符(/)。
如果要匹配多層子目錄里面的文件往枣,應(yīng)該寫成下面這樣伐庭。
$ ls */*/*.txt
# 要匹配n層子目錄,就使用(n+1)個(gè) *
4分冈、通配符可用作文件名使用圾另;
Unix下允許使用通配符?
*
做文件名,建議如果要使用這樣的文件名時(shí)雕沉,請(qǐng)把文件名放入單或雙引號(hào)或者\
進(jìn)行反義里面集乔,避免引人誤解。
$ touch 'aaab?' "aaaab?" aab\? aaac* adddd?
$ ls
aaaab? aaab? aaac* aab? adddd?
$ rm 'aaab?' "aaaab?" aab\? aaac* adddd?
$ ls -lthr --color=tty
total 0
References
Think You Understand Wildcards? Think Again
Advanced Wildcard Patterns Most People Don't Know
—— dulunar 后記于 2020.12