標(biāo)題: 在 lua 的 string 庫中的正則表達(dá)式
作者: 神夢無痕(email:smwh@vip.qq.com)
鏈接:
http://www.reibang.com/p/4fdc274f3573
版權(quán): 本人所有文章歪玲,都遵守“
署名-非商業(yè)性使用-相同方式共享 2.5 中國大陸”協(xié)議條款迁央。
一.前提要了解一下 lua 的string幾個(gè)方法
A、string
庫中所有的字符索引從前往后是1,2,...
;從后往前是-1,-2,...
B滥崩、string
庫中所有的function
都不會(huì)直接操作字符串岖圈,而是返回一個(gè)結(jié)果
string.len(s):返回字符串的長度.
string.lower(s):變小寫.
string.upper(s):變大寫.
string.rep(s,n):將 s 拷貝 n 份,并連接起來,返回.
string.sub(s,i [,j]):取 s 中從 i 開始到 j 為止的自字符串.默認(rèn) j 為長度 -i 表示倒數(shù)
1.
string.find(s, pattern, pos)
第1個(gè)參數(shù):源字符串
第2個(gè)參數(shù):待搜索之模式串
第3個(gè)參數(shù):A hint, 從 pos 位置開始搜索
找到匹配返回:匹配串開始和結(jié)束的位置,否則返回 nil
2.
string.gsub(s, pattern, reps)
string.gsub(s, pattern, func)
第1個(gè)參數(shù):源字符串
第2個(gè)參數(shù):待替換之模式串
第3個(gè)參數(shù):替換為 reps
返回 結(jié)果串 + 匹配數(shù)
--gsub也可以用拷貝捕獲技巧
print(string.gsub("hello, world", "(o)", "%1-%1"))
--> hello-o, wo-orld 2
print(string.gsub("hello Lua", "(.)(.)", "%2%1"))
--> ehll ouLa 4
-- 注意匹配數(shù)用括號(hào)丟棄
function trim (s) return (string.gsub(s, "^%s*(.-)%s*$", "%1")) end
--string.gsub(s, pattern, func)
--第3個(gè)參數(shù):自定義函數(shù)钙皮,對找到的匹配操作蜂科,并傳出替換值
s, n = string.gsub("hello world", "l+", function(s) return "xxx" end)
--> l+一個(gè)或多個(gè)l ,所以替換了 ll 和 l 返回為2
print(s, n)
--> hexxxo worxxxd 2
- 3.
string.gfind
--返回一個(gè)迭代器,迭代器每執(zhí)行一次短条,返回下一個(gè)匹配串导匣;
iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")
print(iter()) --> a=b
print(iter()) --> c=d
--通常用于泛性for循環(huán),下面的例子結(jié)果同上
for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do
print(s)
end
- 4.下面的表列出了
Lua
支持的所有字符類
. 任意字符
%a 字母
%c 控制字符
%d 數(shù)字
%l 小寫字母
%p 標(biāo)點(diǎn)字符
%s 空白符
%u 大寫字母
%w 字母和數(shù)字
%x 十六進(jìn)制數(shù)字
%z 代表0的字符
--上面字符類的大寫形式表示小寫所代表的集合的補(bǔ)集。例如, '%A'非字母的字符:
- 5.模式串中的特殊字符
( ) . % + - * ? [ ^ $
'%' 用作特殊字符的轉(zhuǎn)義字符
'%.' 匹配點(diǎn)
'%%' 匹配字符 '%'茸时。轉(zhuǎn)義字符 '%'不僅可以用來轉(zhuǎn)義特殊字符逐抑,還可以用于所有的非字母的字符。當(dāng)對一個(gè)字符有疑問的時(shí)候屹蚊,為安全起見請使用轉(zhuǎn)義字符轉(zhuǎn)義他厕氨。
用'[]'創(chuàng)建字符集
'[%w_]' 匹配字母數(shù)字和下劃線
'[01]' 匹配二進(jìn)制數(shù)字
'[%[%]]'匹配一對方括號(hào)
在'[]'中使用連字符'-'
'%d' 表示 '[0-9]';
'%x' 表示 '[0-9a-fA-F]'
'[0-7]' 表示 '[01234567]'
在'[]'開始處使用 '^' 表示其補(bǔ)集:
'[^0-7]' 匹配任何不是八進(jìn)制數(shù)字的字符汹粤;
'[^\n]' 匹配任何非換行符戶的字符命斧。
'[^%s]' == '%S'
- 6.模式修飾符
+ 匹配前一字符1次或多次
* 匹配前一字符0次或多次;最長匹配
- 匹配前一字符0次或多次;最短匹配
? 匹配前一字符0次或1次
^ 匹配字符串開頭
$ 匹配字符串結(jié)尾