最近接到了一個(gè)任務(wù)箩绍,要求是給出一系列單詞孔庭,然后看這些單詞是否在某篇文本文檔中出現(xiàn)過,給出輸出結(jié)果是或者否材蛛≡驳剑看到這個(gè)第一時(shí)間香想到的是字符串匹配,最常見的有三種算法仰税,Brute force算法构资,KMP算法,Boyer Moore算法陨簇,關(guān)于三種算法的介紹與比較我不在這里過多的敘述吐绵,網(wǎng)上已經(jīng)有很多人針對這些算法做了比較了,文章下面也會(huì)給出相應(yīng)的參考鏈接河绽。
在當(dāng)我看這些算法的時(shí)候己单,我的室友問了下我干嘛,然后提醒了用正則表達(dá)式會(huì)發(fā)現(xiàn)驚喜的耙饰。于是我去看了下java中關(guān)于正則表達(dá)式的文檔纹笼,讓我找到了 java.util.regex這個(gè)包,看了下介紹確實(shí)很管用苟跪,用起來也很方便廷痘,只要短短的幾行代碼就可以實(shí)現(xiàn)匹配了。
public static void main(String[] args) {
String regEx ="shop";
//檢測要匹配的單詞件已,單詞的前面必須是空格或者標(biāo)點(diǎn)符號
Pattern pattern = Pattern.compile("[^\\w]"+regEx+"[^\\w]");
Matcher matcher = pattern.matcher("yesterday, I entered a shop and bought a pencil.");
booleanresult= matcher.find();
System.out.println(result);
}
輸出:true
關(guān)于字符串的匹配那里用了一個(gè)強(qiáng)大的字符串處理工具——正則表達(dá)式笋额,它擁有自己獨(dú)特的語法以及一個(gè)獨(dú)立的處理引擎,內(nèi)容很復(fù)雜篷扩,但是可以花點(diǎn)時(shí)間快速入門兄猩。
它的功能十分強(qiáng)大,得益于這一點(diǎn),在提供了正則表達(dá)式的語言里枢冤,正則表達(dá)式的語法都是一樣的鸠姨,區(qū)別只在于不同的編程語言實(shí)現(xiàn)支持的語法數(shù)量不同;但不用擔(dān)心淹真,不被支持的語法通常是不常用的部分讶迁。
正則表達(dá)式
參考鏈接:
字符串匹配算法比較
正則表達(dá)式30分鐘入門教程