(一)限定符
1挺尿、?
:它前面的字符需要出現(xiàn)0次或1次
例如:
used?
可以匹配到use
和used
2椒袍、*
:它會(huì)匹配0個(gè)或多個(gè)字符
例如:
ab*c
可以匹配到ac
,abc
,abbbbbbc
3扎即、+
:它會(huì)匹配一次及以上的字符
例如:
ab+c
可以匹配abc
,abbbc
,而不會(huì)匹配ac
4、{}
:可以限定匹配的數(shù)量
例如:
ab{6}c
,則匹配到abbbbbbc
,而要限定b
的數(shù)量在2到6之間胸蛛,則是ab{2,6}c
蝎土,如果只是兩次以上,則省略括號(hào)里的6阵面,寫成ab{2,}c
(二)"或"運(yùn)算符
例如:
a (cat|dog)
匹配的是a cat
和a dog
(三)字符類
[]
:表示里面的內(nèi)容只能取自于它們
例如:
[a-z]
表示所有小寫的英文字母轻局,[abc]
能匹配到abc
,aabbcc
,abcc
,[a-zA-Z]
表示所有的英文字母,如果在[]
前加上^
,表示[]
之外的字符
(四)元字符
\d
:數(shù)字字符样刷,等同于[0-9]
\w
:單詞字符
\s
:空白符仑扑,包含Tab和換行符
\D
:非數(shù)字字符
\W
:非單詞字符
\S
:非空白符
.
:代表任意字符,不包含換行符
^
:匹配行首
例如:
^a
匹配abv
,acccn
$
:匹配行尾
例如:
a$
匹配tea
,cba
(五)貪婪與懶惰匹配
貪婪匹配:正則表達(dá)式通常的行為是匹配盡可能多的字符置鼻,比如這個(gè)表達(dá)式:
a.*b
镇饮,它將會(huì)匹配最長(zhǎng)的以a
開始,以b
結(jié)束的字符串箕母,如果用它來搜索aabab
的話储藐,它會(huì)匹配整個(gè)字符串aabab
懶惰匹配:就是匹配盡可能少的字符俱济,在能使整個(gè)匹配成功的前提下使用最少的重復(fù),只要在它后面加上一個(gè)問號(hào)?即可钙勃,例如
a.*?b
匹配最短的蛛碌,以a
開始,以b
結(jié)束的字符串辖源,如果把它應(yīng)用于aabab
的話蔚携,它會(huì)匹配aab
和ab
,為什么第一個(gè)匹配是aab
(第一到第三個(gè)字符)而不是ab
(第二到第三個(gè)字符)克饶?簡(jiǎn)單地說酝蜒,因?yàn)檎齽t表達(dá)式有一條比懶惰/貪婪規(guī)則優(yōu)先級(jí)更高的規(guī)則,就是:最先開始的匹配擁有最高的優(yōu)先權(quán)
(六)常用的正則表達(dá)式大全
- 數(shù)字:
^[0-9]*$
- n位的數(shù)字:
^\d{n}$
- 至少n位的數(shù)字:
^\d{n,}$
- m-n位的數(shù)字:
^\d{m,n}$
- 零和非零開頭的數(shù)字:
^(0|[1-9][0-9]*)$
- 非零開頭的最多帶兩位小數(shù)的數(shù)字:
^([1-9][0-9]*)+(.[0-9]{1,2})?$
- 帶1-2位小數(shù)的正數(shù)或負(fù)數(shù):
^(\-)?\d+(\.\d{1,2})?$
- 正數(shù)矾湃、負(fù)數(shù)亡脑、和小數(shù):
^(\-|\+)?\d+(\.\d+)?$
- 有兩位小數(shù)的正實(shí)數(shù):
^[0-9]+(.[0-9]{2})?$
- 有1~3位小數(shù)的正實(shí)數(shù):
^[0-9]+(.[0-9]{1,3})?$
- 非零的正整數(shù):
^[1-9]\d*$
或^([1-9][0-9]*){1,3}$
或^\+?[1-9][0-9]*$
- 非零的負(fù)整數(shù):
^\-[1-9][]0-9"*$
或^-[1-9]\d*$
- 非負(fù)整數(shù):
^\d+$
或^[1-9]\d*|0$
- 非正整數(shù):
^-[1-9]\d*|0$
或^((-\d+)|(0+))$
- 非負(fù)浮點(diǎn)數(shù):
^\d+(\.\d+)?$
或^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
- 非正浮點(diǎn)數(shù):
^((-\d+(\.\d+)?)|(0+(\.0+)?))$
或^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
- 正浮點(diǎn)數(shù):
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$
或^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
- 負(fù)浮點(diǎn)數(shù):
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$
或^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
- 浮點(diǎn)數(shù):
^(-?\d+)(\.\d+)?$
或^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
- 漢字:
^[\u4e00-\u9fa5]{0,}$
- 英文和數(shù)字:
^[A-Za-z0-9]+$
或^[A-Za-z0-9]{4,40}$
- 長(zhǎng)度為3-20的所有字符:
^.{3,20}$
- 由26個(gè)英文字母組成的字符串:
^[A-Za-z]+$
- 由26個(gè)大寫英文字母組成的字符串:
^[A-Z]+$
- 由26個(gè)小寫英文字母組成的字符串:
^[a-z]+$
- 由數(shù)字和26個(gè)英文字母組成的字符串:
^[A-Za-z0-9]+$
- 由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串:
^\w+$
或^\w{3,20}$
- 中文洲尊、英文远豺、數(shù)字包括下劃線:
^[\u4E00-\u9FA5A-Za-z0-9_]+$
- 中文奈偏、英文坞嘀、數(shù)字但不包括下劃線等符號(hào):
^[\u4E00-\u9FA5A-Za-z0-9]+$
或^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
- Email地址:
^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
- 域名:
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
- InternetURL:
[a-zA-z]+://[^\s]*
或^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
- 手機(jī)號(hào)碼:
^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
- 電話號(hào)碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"惊来、"XXX-XXXXXXX"丽涩、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):
^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
- 國(guó)內(nèi)電話號(hào)碼(0511-4405222裁蚁、021-87888822):
\d{3}-\d{8}|\d{4}-\d{7}
- 身份證號(hào)(15位矢渊、18位數(shù)字):
^\d{15}|\d{18}$
- 短身份證號(hào)碼(數(shù)字、字母x結(jié)尾):
^([0-9]){7,18}(x|X)?$
或^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
- 帳號(hào)是否合法(字母開頭枉证,允許5-16字節(jié)矮男,允許字母數(shù)字下劃線):
^[a-zA-Z][a-zA-Z0-9_]{4,15}$
- 密碼(以字母開頭,長(zhǎng)度在6~18之間室谚,只能包含字母毡鉴、數(shù)字和下劃線):
^[a-zA-Z]\w{5,17}$
- 強(qiáng)密碼(必須包含大小寫字母和數(shù)字的組合,不能使用特殊字符秒赤,長(zhǎng)度在8-10之間):
^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
- 日期格式:
^\d{4}-\d{1,2}-\d{1,2}
- 一年的12個(gè)月(01~09和1~12):
^(0?[1-9]|1[0-2])$
- 一個(gè)月的31天(01~09和1~31):
^((0?[1-9])|((1|2)[0-9])|30|31)$
- xml文件:
^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
- 中文字符的正則表達(dá)式:
[\u4e00-\u9fa5]
- 雙字節(jié)字符:
[^\x00-\xff]
(包括漢字在內(nèi)猪瞬,可以用來計(jì)算字符串的長(zhǎng)度(一個(gè)雙字節(jié)字符長(zhǎng)度計(jì)2,ASCII字符計(jì)1)) - 空白行的正則表達(dá)式:
\n\s*\r
(可以用來刪除空白行) - 首尾空白字符的正則表達(dá)式:
^\s*|\s*$
或(^\s*)|(\s*$)
(可以用來刪除行首行尾的空白字符(包括空格入篮、制表符陈瘦、換頁(yè)符等等),非常有用的表達(dá)式) - 騰訊QQ號(hào):
[1-9][0-9]{4,}
(騰訊QQ號(hào)從10000開始) - 中國(guó)郵政編碼:
[1-9]\d{5}(?!\d)
(中國(guó)郵政編碼為6位數(shù)字) - IP地址:
\d+\.\d+\.\d+\.\d+
(提取IP地址時(shí)有用) - IP地址:
((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))
- IP-v4地址:
\\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\b
(提取IP地址時(shí)有用) - 子網(wǎng)掩碼:
((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))
- 校驗(yàn)日期:
^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$
(“yyyy-mm-dd“ 格式的日期校驗(yàn)潮售,已考慮平閏年痊项。) - 抽取注釋:``