Perl 兼容正則表達(dá)式函數(shù)
語法:
1. 表達(dá)式的格式: "/表達(dá)式/[修正符]"
解釋:其中"/"表示正則表達(dá)式的定界符暑始,但是也可以是其他符號:如”#“苞七,”忆肾!“
注意:定界符不可以是字母白指、數(shù)字和斜線\。
像“#”印蔗、“|”扒最、“!”等都可以的
如:/.../ #...# |....|
其中修正符是可選的,表示對表達(dá)式做額外的修飾华嘹。
正則表達(dá)式的組成部分:
正則表達(dá)式的組成部分:
----------------------------------------------------
1. 原子是組成正則表達(dá)式的基本單位,在分析正則表達(dá)式時吧趣,應(yīng)作為一個整體。
原子包括以下內(nèi)容:
> 單個字符耙厚、數(shù)字再菊,如a-z,A-Z颜曾,0-9。
> 模式單元秉剑,如(ABC)可以理解為由多個原子組成的大的原子泛豪。
> 原子表,如 [ABC]侦鹏。
> 重新使用的模式單元诡曙,如:\\1
> 普通轉(zhuǎn)義字符,如:\d略水, \D价卤, \w
> 轉(zhuǎn)義元字符,如:\*渊涝,\.
*> 元字符
*2. 元字符(具有特殊意義字符):
[] 表示單個字符的原子表
例如:[aoeiu] 表示任意一個元音字母
[0-9] 表示任意一位數(shù)字
[a-z][0-9]表示小寫字和一位數(shù)字構(gòu)成的兩位字符
[a-zA-Z0-9] 表示任意一位大小字母或數(shù)字
[^] 表示除中括號內(nèi)原子之外的任何字符 是[]的取反
例如:[^0-9] 表示任意一位非數(shù)字字符
[^a-z] 表示任意一位非小寫字母
{m} 表示對前面原子的數(shù)量控制慎璧,表示是m次
例如:[0-9]{4} 表示4位數(shù)字0000-9999
[1][3-8][0-9]{9} 手機(jī)號碼
[\-]?[0-9]+
{m,} 表示對前面原子的數(shù)量控制床嫌,表示是至少m次
例如: [0-9]{2,} 表示兩位及以上的數(shù)字
{m,n}表示對前面原子的數(shù)量控制,表示是m到n次
例如: [a-z]{6,8} 表示6到8位的小寫字母
* 表示對前面原子的數(shù)量控制胸私,表示是任意次厌处,等價于{0,}
+ 表示對前面原子的數(shù)量控制,表示至少1次岁疼,等價于{1,}
? 表示對前面原子的數(shù)量控制阔涉,表示0次或1次(可有可無) 等價于{0,1}
例如:正整數(shù):[1-9][0-9]*
整數(shù):[\-]?[0-9]+
email:
() 表示一個整體原子,【還有一個子存儲單元的作用】捷绒。
也可以使用?:來拒絕子存儲瑰排。 (?:.*?)
例如:(red) 字串red
(red|blue) 字串red或blue
(abc){2} 表示兩個abc
| 表示或的意思
(rea|blue) 字串red或blue
^ 用在正則單元塊的開頭處,表示必須以指定的開頭
$ 用在正則單元塊的結(jié)尾處暖侨,表示必須以指定的結(jié)尾
. 表示任意一個除換行符之外的字符
常用組合: .*? 或 .+? 表示最小匹配所有字符(拒絕貪婪匹配)
3. 普通轉(zhuǎn)義字符:
*\d 匹配一個數(shù)字椭住;等價于[0-9]
*\D 匹配除數(shù)字以外任何一個字符;等價于[^0-9]
*\w 匹配一個英文字母它碎、數(shù)字或下劃線函荣;等價于[0-9a-zA-Z_]
*\W 匹配除英文字母、數(shù)字和下劃線以外任何一個字符扳肛;等價于[^0-9a-zA-Z_]
*\s 匹配一個空白字符傻挂;等價于[\f\n\r\t\v]
*\S 匹配除空白字符以外任何一個字符;等價于[^\f\n\r\t\v]
\f 匹配一個換頁符等價于 \x0c 或 \cL
*\n 匹配一個換行符挖息;等價于 \x0a 或 \cJ
*\r 匹配一個回車符等價于\x0d 或 \cM
*\t 匹配一個制表符金拒;等價于 \x09\或\cl
\v 匹配一個垂直制表符;等價于\x0b或\ck
\oNN 匹配一個八進(jìn)制數(shù)字
\xNN 匹配一個十六進(jìn)制數(shù)字
\cC 匹配一個控制字符
/^-?\d+$|^-?0[xX][\da-fA-F]+$/ 表示十進(jìn)制和十六進(jìn)制的一個數(shù)字
^-?\d+$ ^-?0[xX][\da-fA-F]+$
//表示一個郵箱地址
/^[0-9a-zA-Z_-]+@[0-9a-zA-Z_-]+(\.[0-9a-zA-Z_-]+){0,3}$/
4. 模式修整符
i 表示不區(qū)分大小寫套腹;
"/[a-zA-Z]/" <==>"/[a-z]/i"
s 表示匹配視為單行(就是可以讓點(diǎn).支持換行)
U 表示拒絕貪婪匹配
四绪抛、 正則表達(dá)式的函數(shù):
--------------------------------------------------
preg_grep -- 返回與模式匹配的數(shù)組單元
* preg_match_all -- 進(jìn)行全局正則表達(dá)式匹配 , 返回共計匹配的個數(shù)。
和下面的一樣电禀,不同的是匹配到最后(全局匹配)
* preg_match -- 進(jìn)行正則表達(dá)式匹配幢码,只匹配一次,返回1尖飞,否則0症副,
格式:preg_match("正則表達(dá)式","被匹配的字串",存放結(jié)果的變量 名,PREG_OFFSET_CAPTURE,起始偏移量)
其中:PREG_OFFSET_CAPTURE表示獲取匹配索引位置
起始偏移量:從指定位置開始匹配
preg_quote -- 轉(zhuǎn)義正則表達(dá)式字符
preg_replace_callback -- 用回調(diào)函數(shù)執(zhí)行正則表達(dá)式的搜索和替換
*preg_replace -- 執(zhí)行正則表達(dá)式的搜索和替換
*preg_split -- 用正則表達(dá)式分割字符串