Java正則表達(dá)式API之系列（三）

Boundary Matchers
Java regex API還支持邊界匹配翔烁。如果我們關(guān)心在輸入文本中匹配的確切位置删铃，那么這就是我們要尋找的权薯。在前面的示例中鸵赖，我們關(guān)心的只是是否找到匹配項(xiàng)。

為了僅在文本開(kāi)頭所需的正則表達(dá)式為true時(shí)匹配，我們使用插入符號(hào)^。

此測(cè)試將失敗，因?yàn)榭梢栽陂_(kāi)頭找到文本 dog ：

@Test
public void givenText_whenMatchesAtBeginning_thenCorrect() {
int matches = runTest("^dog", "dogs are friendly");

assertTrue(matches > 0);

}
下面的測(cè)試將失敳诩啊：

@Test
public void givenTextAndWrongInput_whenMatchFailsAtBeginning_
thenCorrect() {
int matches = runTest("^dog", "are dogs are friendly?");

assertFalse(matches > 0);

}
為了僅在文本末尾所需的正則表達(dá)式為true時(shí)匹配，我們使用美元字符 $ 筛欢。在以下情況下會(huì)找到匹配項(xiàng)：

@Test
public void givenText_whenMatchesAtEnd_thenCorrect() {
int matches = runTest("dog$", "Man's best friend is a dog");

assertTrue(matches > 0);

}
并且沒(méi)有找到匹配：

@Test
public void givenTextAndWrongInput_whenMatchFailsAtEnd_thenCorrect() {
int matches = runTest("dog$", "is a dog man's best friend?");

assertFalse(matches > 0);

}
如果僅在單詞邊界處找到所需文本時(shí)才需要匹配浸锨，則在正則表達(dá)式的開(kāi)頭和結(jié)尾使用 \b 正則表達(dá)式：

空格是單詞邊界：

@Test
public void givenText_whenMatchesAtWordBoundary_thenCorrect() {
int matches = runTest("\bdog\b", "a dog is friendly");

assertTrue(matches > 0);

}
行首的空字符串也是單詞邊界：

@Test
public void givenText_whenMatchesAtWordBoundary_thenCorrect2() {
int matches = runTest("\bdog\b", "dog is man's best friend");

assertTrue(matches > 0);

}
這些測(cè)試之所以通過(guò)，是因?yàn)樽址拈_(kāi)頭以及文本之間的空格標(biāo)記了單詞邊界版姑，但是以下測(cè)試顯示了相反的結(jié)果：

@Test
public void givenWrongText_whenMatchFailsAtWordBoundary_thenCorrect() {
int matches = runTest("\bdog\b", "snoop dogg is a rapper");

assertFalse(matches > 0);

}
一行中出現(xiàn)的兩個(gè)單詞字符不會(huì)標(biāo)記單詞邊界柱搜，但我們可以通過(guò)更改正則表達(dá)式的結(jié)尾來(lái)查找非單詞邊界：

@Test
public void givenText_whenMatchesAtWordAndNonBoundary_thenCorrect() {
int matches = runTest("\bdog\B", "snoop dogg is a rapper");
assertTrue(matches > 0);
}
Pattern Class Methods
之前，我們只以基本方式創(chuàng)建了模式對(duì)象剥险。然而聪蘸，這個(gè)類(lèi)有另一個(gè)compile方法的變體，它接受一組標(biāo)志以及影響模式匹配方式的regex參數(shù)表制。

這些標(biāo)志只是抽象的整數(shù)值健爬。讓我們重載test類(lèi)中的runTest方法，以便它可以將標(biāo)志作為第三個(gè)參數(shù)：

public static int runTest(String regex, String text, int flags) {
pattern = Pattern.compile(regex, flags);
matcher = pattern.matcher(text);
int matches = 0;
while (matcher.find()){
matches++;
}
return matches;
}
在本節(jié)中么介，我們將了解不同的支持標(biāo)志以及它們的使用方式娜遵。

Pattern.CANON_EQ
此標(biāo)志啟用 canonical equivalence ，當(dāng)且僅當(dāng)兩個(gè)字符的完整規(guī)范分解匹配時(shí)壤短，才會(huì)認(rèn)為這兩個(gè)字符匹配设拟。

考慮帶重音的Unicode字符 é 。它的復(fù)合代碼點(diǎn)是什么 u00E9 鸽扁。但是蒜绽，Unicode的組成字符 e 、 u0065 和 u0301 也有單獨(dú)的代碼點(diǎn)桶现。在這種情況下，合成字符 u00E9 與雙字符序列 u0065 u0301 無(wú)法區(qū)分鼎姊。

默認(rèn)情況下骡和，匹配不考慮規(guī)范等效：

@Test
public void givenRegexWithoutCanonEq_whenMatchFailsOnEquivalentUnicode_thenCorrect() {
int matches = runTest("\u00E9", "\u0065\u0301");

assertFalse(matches > 0);

}
但如果添加標(biāo)志，則測(cè)試將通過(guò)：

@Test
public void givenRegexWithCanonEq_whenMatchesOnEquivalentUnicode_thenCorrect() {
int matches = runTest("\u00E9", "\u0065\u0301", Pattern.CANON_EQ);

assertTrue(matches > 0);

}
Pattern.CASE_INSENSITIVE
無(wú)論大小寫(xiě)相寇，此標(biāo)志都支持匹配慰于。默認(rèn)情況下，匹配會(huì)考慮大小寫(xiě)：

@Test
public void givenRegexWithDefaultMatcher_whenMatchFailsOnDifferentCases_thenCorrect() {
int matches = runTest("dog", "This is a Dog");

assertFalse(matches > 0);

}
因此唤衫，使用此標(biāo)志婆赠，我們可以更改默認(rèn)行為：

@Test
public void givenRegexWithCaseInsensitiveMatcher
_whenMatchesOnDifferentCases_thenCorrect() {
int matches = runTest(
"dog", "This is a Dog", Pattern.CASE_INSENSITIVE);

assertTrue(matches > 0);

}
我們還可以使用等效的嵌入標(biāo)志表達(dá)式來(lái)實(shí)現(xiàn)相同的結(jié)果：

@Test
public void givenRegexWithEmbeddedCaseInsensitiveMatcher
_whenMatchesOnDifferentCases_thenCorrect() {
int matches = runTest("(?i)dog", "This is a Dog");

assertTrue(matches > 0);

}
Pattern.COMMENTS
Java API允許在正則表達(dá)式中包含使用#的注釋。這有助于記錄復(fù)雜的正則表達(dá)式佳励，而其他程序員可能無(wú)法立即看到這些正則表達(dá)式休里。

comments標(biāo)志使matcher忽略正則表達(dá)式中的任何空白或注釋?zhuān)豢紤]模式蛆挫。在默認(rèn)匹配模式下，以下測(cè)試將失斆钍颉：

@Test
public void givenRegexWithComments_whenMatchFailsWithoutFlag_thenCorrect() {
int matches = runTest(
"dog$ #check for word dog at end of text", "This is a dog");

assertFalse(matches > 0);

}
這是因?yàn)槠ヅ淦鲗⒃谳斎胛谋局胁檎艺麄€(gè)正則表達(dá)式悴侵，包括空格和 # 字符。但當(dāng)我們使用該標(biāo)志時(shí)拭嫁，它將忽略額外的空格可免，并且以 # 開(kāi)頭的每個(gè)文本都將被視為每行要忽略的注釋?zhuān)?/p>

@Test
public void givenRegexWithComments_whenMatchesWithFlag_thenCorrect() {
int matches = runTest(
"dog$ #check end of text","This is a dog", Pattern.COMMENTS);

assertTrue(matches > 0);

}
還有一個(gè)替代的嵌入式標(biāo)志的表達(dá)方式：

@Test
public void givenRegexWithComments_whenMatchesWithEmbeddedFlag_thenCorrect() {
int matches = runTest(
"(?x)dog$ #check end of text", "This is a dog");

assertTrue(matches > 0);

}

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市做粤，隨后出現(xiàn)的幾起案子浇借，更是在濱河造成了極大的恐慌，老刑警劉巖怕品，帶你破解...
沈念sama閱讀 218,451評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件逮刨，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡堵泽，警方通過(guò)查閱死者的電腦和手機(jī)修己，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,172評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)迎罗，“玉大人睬愤，你說(shuō)我怎么就攤上這事∥瓢玻” “怎么了尤辱？”我有些...
開(kāi)封第一講書(shū)人閱讀 164,782評(píng)論 0贊 354
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)厢岂。經(jīng)常有香客問(wèn)我光督，道長(zhǎng)，這世上最難降的妖魔是什么塔粒？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,709評(píng)論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任结借，我火速辦了婚禮，結(jié)果婚禮上卒茬，老公的妹妹穿的比我還像新娘船老。我一直安慰自己，他們只是感情好圃酵，可當(dāng)我...
茶點(diǎn)故事閱讀 67,733評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布柳畔。她就那樣靜靜地躺著，像睡著了一般郭赐。火紅的嫁衣襯著肌膚如雪薪韩。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 51,578評(píng)論 1贊 305
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音俘陷，去河邊找鬼罗捎。笑死，一個(gè)胖子當(dāng)著我的面吹牛岭洲，可吹牛的內(nèi)容都是我干的宛逗。我是一名探鬼主播，決...
沈念sama閱讀 40,320評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼盾剩，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼雷激！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起告私，我...
開(kāi)封第一講書(shū)人閱讀 39,241評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤屎暇，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后驻粟，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體根悼，經(jīng)...
沈念sama閱讀 45,686評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,878評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年蜀撑，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了挤巡。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,992評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡酷麦，死狀恐怖矿卑，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情沃饶，我是刑警寧澤母廷，帶...
沈念sama閱讀 35,715評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站糊肤，受9級(jí)特大地震影響琴昆，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜馆揉，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,336評(píng)論 3贊 330
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一业舍、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧把介，春花似錦勤讽、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,912評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)向臀。三九已至巢墅，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背君纫。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,040評(píng)論 1贊 270
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工驯遇，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人蓄髓。一個(gè)月前我還...
沈念sama閱讀 48,173評(píng)論 3贊 370
代替公主和親
正文我出身青樓叉庐，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親会喝。傳聞我的和親對(duì)象是個(gè)殘疾皇子陡叠，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,947評(píng)論 2贊 355

Java正則表達(dá)式API之系列（三）

推薦閱讀更多精彩內(nèi)容