關(guān)于正則表達(dá)式的簡單介紹

正則表達(dá)式指符合一定規(guī)則的表達(dá)式琢歇，專門用于操作字符串谆甜。用一些特定的符號(hào)來表示一些代碼操作，以此來簡化書寫届吁。只需要書寫簡短的正則字符串就可以完成非常復(fù)雜的字符匹配操作错妖。學(xué)習(xí)正則表達(dá)式最重要的就是學(xué)習(xí)如何寫正則，而正則本身又是各種符號(hào)的組合體疚沐。所以學(xué)習(xí)正則表達(dá)式暂氯，就是在學(xué)習(xí)一些特殊符號(hào)的使用。

正則雖然簡便亮蛔，但是其弊端也多株旷，做重要的就是兩點(diǎn)：

閱讀性會(huì)隨著符號(hào)定義的越多而變得非常非常差；
其效率真的不敢恭維尔邓。

雖然其弊端存在晾剖，但是學(xué)習(xí)這個(gè)東西還是非常有必要的，因?yàn)樵谔幚硪恍┳址膯栴}是避不開正則的梯嗽，而且在很多時(shí)候使用正則卻是最省事的齿尽。

正則表達(dá)式的簡單介紹

既然是學(xué)習(xí)正則，那就要對(duì)正則有一個(gè)簡單的介紹灯节，此處不是希望讀者能夠讀懂或是能夠按要求自己寫正則循头，只是讓讀者對(duì)正則有一個(gè)簡單的認(rèn)知，至少知道這些字符串是正則炎疆。下面就列舉了一些正則表達(dá)式卡骂，并以此來介紹一下正則表達(dá)式：

" +"：表示一個(gè)或多個(gè)空格
[abc]：表示一個(gè)字符是a或b或c
[a-zA-Z]：表示a到z或A到Z，兩頭的字母包括在內(nèi)（范圍）
^\\w+$：由數(shù)字形入、26個(gè)英文字母或下劃線組成的字符串
^[\\u4e00-\\u9fa5]{0,}$：字符串僅能是中文
^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$：國內(nèi) 13全跨、15、18開頭的手機(jī)號(hào)正則
^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$：校驗(yàn)密碼長度亿遂，密碼的強(qiáng)度必須是包含大小寫字母和數(shù)字的組合浓若，不能使用特殊字符渺杉，長度在8-10之間

以上是幾個(gè)正則，有簡單的挪钓，也有比較難的是越。通過這些正則，能夠?qū)φ齽t有一個(gè)初步的印象碌上，至于這個(gè)正則里面的符號(hào)各個(gè)是什么意思倚评，可用看最后一節(jié)。

正則表達(dá)式的用處：

上面對(duì)正則有了一個(gè)初步的介紹馏予，那么現(xiàn)在就該將其用法了天梧。通過去使用正則表達(dá)式，逐步加深對(duì)正則的理解吗蚌。實(shí)踐是檢驗(yàn)真理的唯一標(biāo)識(shí)腿倚，知道怎么使用纯出，那就可以自己去試著寫一寫正則來看看蚯妇。
對(duì)于正則的用處，我將其分成4種暂筝，分別是：匹配箩言、切割、替換和獲取焕襟。每一個(gè)用法都對(duì)應(yīng)了一些API的調(diào)用陨收，下面就來看一看怎么使用正則。另外鸵赖，通過正則一個(gè)字符串種獲取符合規(guī)則是正則的最大的用處务漩，因此獲取最好熟練掌握，特別是那幾個(gè)方法的使用它褪。

匹配

確定一個(gè)字符串是否完全符合正則表達(dá)式饵骨。用規(guī)則匹配整個(gè)字符串，如果有一處不符合就匹配結(jié)束茫打，使用方法：

String :  boolean matches(String regex)

切割

將一個(gè)字符串通過指定正則切割為多個(gè)字符串居触。

String :  String[] split(String regex)

這個(gè)方法應(yīng)該是在工作用的比較多的，例如使用正則" +"是按一個(gè)或多個(gè)空格來切割老赤，就不多解釋了轮洋。

替換

將字符串中所有匹配給定的正則表達(dá)式的子字符串進(jìn)行替換。

 String :  String replaceAll(String  regex, String  replacement)
 //使用給定的 replacement 替換此字符串所有匹配給定的正則表達(dá)式的子字符串抬旺。

這個(gè)方式很容易理解弊予，但這里有個(gè)需要注意的地方：在String類中還有一個(gè)相似的replace方法，這個(gè)方法也是進(jìn)行替換的开财，但是問題在于這個(gè)方法不使用正則块促，僅僅是進(jìn)行字面值的匹配荣堰。

獲取

從一個(gè)字符串中獲取符合正則表達(dá)式的子字符串。這個(gè)用法是所有正則用法中最常用的竭翠，因此需要熟練掌握振坚。在介紹如何進(jìn)行獲取之前，先介紹兩個(gè)相關(guān)的類：Pattern斋扰、Matcher渡八。
獲取的操作，主要是Pattern传货、Matcher 這兩個(gè)類的使用屎鳍，將字符串中符合規(guī)則的子串取出。上面提到的其他的操作再底層也是通過這兩個(gè)對(duì)象來進(jìn)行的问裕。

Pattern 類代表一個(gè)正則表達(dá)式對(duì)象逮壁，其由靜態(tài)方法創(chuàng)建，與特定要匹配的字符串無關(guān)粮宛，僅僅代表一個(gè)正則表達(dá)式對(duì)象
Matcher 類代表一個(gè)字符串與正則進(jìn)行結(jié)合后的匹配器窥淆，通過它可以對(duì)字符串進(jìn)行很多操作。通常由Pattern.matches(CharSequence input)創(chuàng)建而來巍杈。

其中忧饭，Matcher常用的方法有：find()、reset()筷畦、group()词裤、start()、end()鳖宾，最常用的進(jìn)行獲取的例子如下：

    String data = "M634.6458,109.730835C633.93176,110.02402  633.11017,110.45207 
633.5371,110.86981C635.0685,112.36824 636.26434,111.89019 638.5624,113.56317";
    String regex = "[MQC][^MQC]+";

    data = data.replaceAll("\\s+"," ");

    Pattern pattern = Pattern.compile(regex);
    Matcher matcher = pattern.matcher(data);

    while(matcher.find()) {
        System.out.println("find: "+matcher.group());
    }

下面是出現(xiàn)的與獲取子串相關(guān)一些函數(shù)的說明：
find() 從當(dāng)前索引處開始進(jìn)行一次匹配吼砂；
group() 獲取當(dāng)前匹配到的子串；
start() 返回當(dāng)前匹配到的子串的第一個(gè)字符的位置鼎文；
end() 返回當(dāng)前匹配到的子串的最后一個(gè)字符的位置渔肩；
reset() 重置當(dāng)前匹配器，此時(shí)其索引重新置為字符串初始位置漂问；

正則表達(dá)式的特點(diǎn)

正則雖然復(fù)雜赖瞒，但是只要記住幾點(diǎn)就能夠?qū)φ齽t有一個(gè)大致的認(rèn)識(shí)，然后在匹配文檔就可明確這個(gè)正則的具體意義蚤假。下面是個(gè)人總結(jié)的一些正則的特點(diǎn)栏饮，讀者可看可不看，畢竟仁者見仁智者見智：

[] 中括號(hào)表示字符串中的一個(gè)字符： [abc]表示出現(xiàn)a或b或c
Java 中的字符串會(huì)對(duì)\\進(jìn)行轉(zhuǎn)義磷仰，所以當(dāng)需要使用\\時(shí)袍嬉，就需要連續(xù)使用兩個(gè)\\，所以在
Java 正則中出現(xiàn)的反斜杠都是成對(duì)出現(xiàn)的
正則是逐次判斷的，對(duì)于數(shù)量可以用大括號(hào){}或+或*等來判斷
小括號(hào)表示組的概念伺通，一個(gè)規(guī)則使用小括號(hào)括起來為組箍土，可以用來重用其結(jié)果，其編號(hào)從1開始自動(dòng)生成罐监，例如"(.)\\1"表示疊詞（兩個(gè)相同的詞）吴藻。為了可以讓規(guī)則的結(jié)果被重用，可以將規(guī)則封裝成一個(gè)組弓柱，用()完成沟堡，組的出現(xiàn)都有編號(hào)，從1開始矢空，想要使用已有的組可以通過\n(n就是組的編號(hào))的形式來獲取

正則表達(dá)式的構(gòu)造

正則的構(gòu)造是通過特殊字符的組合航罗，一下給出常用的用于構(gòu)造正則的符號(hào)和其表達(dá)意義，但并非所有屁药。在進(jìn)行正則構(gòu)造的時(shí)候粥血，可以使用。

字符類	意義
[abc]	a、b 或 c（簡單類）
[^abc]	任何字符，除了 a、b 或 c（否定）
[a-zA-Z]	a 到 z 或 A 到 Z，兩頭的字母包括在內(nèi)（范圍）
[a-d[m-p]]	a 到 d 或 m 到 p：[a-dm-p]（并集）
[a-z&&[def]]	d轨蛤、e 或 f（交集）
[a-z&&[^bc]]	a 到 z，除了 b 和 c：[ad-z]（減去）
[a-z&&[^m-p]]	a 到 z因宇，而非 m 到 p：[a-lq-z]（減去）

預(yù)定義字符類	意義
.	任何字符（與行結(jié)束符可能匹配也可能不匹配）
\d	數(shù)字：[0-9]
\D	非數(shù)字： [^0-9]
\s	空白字符：[ \t\n\x0B\f\r]
\S	非空白字符：[^\s]
\w	單詞字符：[a-zA-Z_0-9]
\W	非單詞字符：[^\w]

邊界匹配器	意義
^	行的開頭
$	行的結(jié)尾
\b	單詞邊界
\B	非單詞邊界
\A	輸入的開頭
\G	上一個(gè)匹配的結(jié)尾
\Z	輸入的結(jié)尾恤筛，僅用于最后的結(jié)束符（如果有的話）
\z	輸入的結(jié)尾

Greedy數(shù)量詞	意義
X?	X，一次或一次也沒有
X*	X饶氏，零次或多次
X+	X讥耗，一次或多次
X{n}	X，恰好 n 次
X{n,}	X疹启，至少 n 次
X{n,m}	X古程，至少 n 次，但是不超過 m 次

常用的正則表達(dá)式

1 . 校驗(yàn)密碼強(qiáng)度
密碼的強(qiáng)度必須是包含大小寫字母和數(shù)字的組合喊崖，不能使用特殊字符挣磨，長度在8-10之間。

^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

校驗(yàn)中文
字符串僅能是中文荤懂。

^[\\u4e00-\\u9fa5]{0,}$

由數(shù)字茁裙、26個(gè)英文字母或下劃線組成的字符串

^\\w+$

校驗(yàn)E-Mail 地址
同密碼一樣，下面是E-mail地址合規(guī)性的正則檢查語句节仿。

[\\w!#$%&'*+/=?^_`{|}~-]+(?:\\.[\\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\\w](?:[\\w-]*[\\w])?\\.)+[\\w](?:[\\w-]*[\\w])?

校驗(yàn)身份證號(hào)碼
下面是身份證號(hào)碼的正則校驗(yàn)晤锥。15 或 18位。
15位：

^[1-9]\\d{7}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}$

18位：

^[1-9]\\d{5}[1-9]\\d{3}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}([0-9]|X)$

校驗(yàn)日期
yyyy-mm-dd 格式的日期校驗(yàn)，已考慮平閏年矾瘾。

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

校驗(yàn)金額
金額校驗(yàn)女轿，精確到2位小數(shù)。

^[0-9]+(.[0-9]{2})?$

校驗(yàn)手機(jī)號(hào)
下面是國內(nèi) 13壕翩、15蛉迹、18開頭的手機(jī)號(hào)正則表達(dá)式。

^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$

判斷IE的版本
IE目前還沒被完全取代放妈，很多頁面還是需要做版本兼容婿禽，下面是IE版本檢查的表達(dá)式。

^.*MSIE [5-8](?:\\.[0-9]+)?(?!.*Trident\\/[5-9]\\.0).*$

校驗(yàn)IP-v4地址
IP4 正則語句大猛。

\\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\b

校驗(yàn)IP-v6地址
IP6 正則語句扭倾。

(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))

檢查URL的前綴
應(yīng)用開發(fā)中很多時(shí)候需要區(qū)分請求是HTTPS還是HTTP，通過下面的表達(dá)式可以取出一個(gè)url的前綴然后再邏輯判斷挽绩。

if (!s.match(/^[a-zA-Z]+:\\/\\//)){ s = 'http://' + s;}

提取URL鏈接
下面的這個(gè)表達(dá)式可以篩選出一段文本中的URL膛壹。

^(f|ht){1}(tp|tps):\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- ./?%&=]*)?

文件路徑及擴(kuò)展名校驗(yàn)
驗(yàn)證文件路徑和擴(kuò)展名

^([a-zA-Z]\\:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/:*?"<>|]+\\.txt(l)?$

提取Color Hex Codes
有時(shí)需要抽取網(wǎng)頁中的顏色代碼，可以使用下面的表達(dá)式唉堪。

\\#([a-fA-F]|[0-9]){3,6}

提取網(wǎng)頁圖片
假若你想提取網(wǎng)頁中所有圖片信息模聋，可以利用下面的表達(dá)式。

\\< *[img][^\\>]*[src] *= *[\\"\\']{0,1}([^\\"\\'\\ >]*)

提取頁面超鏈接
提取html中的超鏈接唠亚。

(]*)(href="https?://)((?!(?:(?:www\\.)?'.implode('|(?:www\\.)?', $follow_list).'))[^"]+)"((?!.*\\brel=)[^>]*)(?:[^>]*)>

精煉CSS
通過下面的表達(dá)式链方，可以搜索相同屬性值的CSS，從而達(dá)到精煉代碼的目的灶搜。

^\\s*[a-zA-Z\\-]+\\s*[:]{1}\\s[a-zA-Z0-9\\s.#]+[;]{1}

匹配HTML標(biāo)簽
通過下面的表達(dá)式可以匹配出HTML中的標(biāo)簽祟蚀。

\\s]+))?)+\\s*|\\s*)/?>

最后編輯于：2017.12.06 20:26:05

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市割卖，隨后出現(xiàn)的幾起案子前酿，更是在濱河造成了極大的恐慌，老刑警劉巖鹏溯，帶你破解...
沈念sama閱讀 206,214評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件罢维，死亡現(xiàn)場離奇詭異，居然都是意外死亡丙挽，警方通過查閱死者的電腦和手機(jī)肺孵，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,307評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來颜阐，“玉大人平窘，你說我怎么就攤上這事∷才ǎ” “怎么了初婆？”我有些...
開封第一講書人閱讀 152,543評(píng)論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我磅叛，道長屑咳，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,221評(píng)論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任弊琴，我火速辦了婚禮兆龙，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘敲董。我一直安慰自己紫皇，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 64,224評(píng)論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布腋寨。她就那樣靜靜地躺著聪铺，像睡著了一般。火紅的嫁衣襯著肌膚如雪萄窜。梳的紋絲不亂的頭發(fā)上铃剔，一...
開封第一講書人閱讀 49,007評(píng)論 1贊 284
城市分裂傳說
那天，我揣著相機(jī)與錄音查刻，去河邊找鬼键兜。笑死，一個(gè)胖子當(dāng)著我的面吹牛穗泵，可吹牛的內(nèi)容都是我干的普气。我是一名探鬼主播，決...
沈念sama閱讀 38,313評(píng)論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼佃延，長吁一口氣：“原來是場噩夢啊……” “哼现诀！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起苇侵，我...
開封第一講書人閱讀 36,956評(píng)論 0贊 259
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤赶盔，失蹤者是張志新（化名）和其女友劉穎企锌，沒想到半個(gè)月后榆浓，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,441評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡撕攒，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,925評(píng)論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年陡鹃，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片抖坪。...
茶點(diǎn)故事閱讀 38,018評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡萍鲸，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出擦俐，到底是詐尸還是另有隱情脊阴，我是刑警寧澤，帶...
沈念sama閱讀 33,685評(píng)論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站嘿期，受9級(jí)特大地震影響品擎，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜备徐，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,234評(píng)論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一萄传、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧蜜猾，春花似錦秀菱、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,240評(píng)論 0贊 19
一樁弒父案衍菱，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至肩豁，卻和暖如春梦碗，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背蓖救。一陣腳步聲響...
開封第一講書人閱讀 31,464評(píng)論 1贊 261
情欲美人皮
我被黑心中介騙來泰國打工洪规，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人循捺。一個(gè)月前我還...
沈念sama閱讀 45,467評(píng)論 2贊 352
代替公主和親
正文我出身青樓斩例，卻偏偏與公主長得像，于是被迫代替她去往敵國和親从橘。傳聞我的和親對(duì)象是個(gè)殘疾皇子念赶，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,762評(píng)論 2贊 345