一. 概述
蘋果對(duì)一些常用的正則匹配都作了封裝,如時(shí)間,時(shí)區(qū),網(wǎng)頁(yè)鏈接url,電話號(hào)碼等等,而且這些識(shí)別是國(guó)際化的,比如中國(guó)的手機(jī)號(hào)是13044345467,XX國(guó)的手機(jī)號(hào)是932-23333222,它都可以識(shí)別.又比如中國(guó)人的名字是王大明,英國(guó)人的名字是 William Jafferson Clinton,也都能識(shí)別.
我們不用自己去寫正則表達(dá)式匹配,而采用NSDataDetector.
閱讀它的描述已經(jīng)能獲取大多數(shù)信息.
二. 使用方法:
1. 使用NSRegularExpression的方法.
作為NSRegularExpression的子類,它可使用其所有方法.numberOfMatchesInString:options:range就是其一,查看一共有多少匹配項(xiàng).還有matches(in:options:range:)和firstMatch(in:options:range:)
NSString * string = @"歡迎訪問http://www.111cn.net,https://111cn.net\n以及ftp://111cn.net";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypePhoneNumber| NSTextCheckingTypeLink error:&error];
NSUInteger numberOfMatches = [detector numberOfMatchesInString:string
options:0
range:NSMakeRange(0, [string length])];
2. 這是matches(in:options:range:)的用法:
NSString * string = @"歡迎訪問http://www.reibang.com/users/72ee5da886ff/latest_articles. 咱的電話是012-1304445928.ps:電話隨便寫的喲.今天是2016-10-25,天氣(weather)不錯(cuò)";
NSString * string = @"歡迎訪問http://www.reibang.com/users/72ee5da886ff/latest_articles. 咱的電話是012-1304445928.ps:電話隨便寫的喲.今天是2016-10-25,天氣(weather)不錯(cuò)";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink|NSTextCheckingTypePhoneNumber error:&error];
NSArray *matches = [detector matchesInString:string
options:0
range:NSMakeRange(0, [string length])];
for (NSTextCheckingResult *match in matches) {
NSRange matchRange = [match range];
if ([match resultType] == NSTextCheckingTypeLink) {
NSURL *url = [match URL];
NSLog(@"url:%@", url);
} else if ([match resultType] == NSTextCheckingTypePhoneNumber) {
NSString *phoneNumber = [match phoneNumber];
NSLog(@"phoneNumber:%@", phoneNumber);
}
}
3.塊是另一種形式,比較靈活和高效.
為何?因?yàn)樗敲空业揭粋€(gè)match,就進(jìn)入塊一次.
比如一共有4個(gè)match,它就會(huì)進(jìn)入4次塊.
所以你可以用塊的參數(shù)stop控制這個(gè)塊.如果你已經(jīng)找到需要的match,就設(shè)置stop為YES,就不會(huì)繼續(xù)找match了.
NSString * string = @"歡迎訪問http://www.reibang.com/users/72ee5da886ff/latest_articles. 咱的電話是012-1304445928.ps:電話隨便寫的喲.今天是2016-10-25,天氣(weather)不錯(cuò)";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink|NSTextCheckingTypePhoneNumber error:&error];
__block NSUInteger count = 0;
[detector enumerateMatchesInString:string options:0 range:NSMakeRange(0, [string length]) usingBlock:^(NSTextCheckingResult * _Nullable match, NSMatchingFlags flags, BOOL * _Nonnull stop) {
NSLog(@"flag:%lu",(unsigned long)flags);
NSRange matchRange = [match range];
if ([match resultType] == NSTextCheckingTypeLink) {
NSURL *url = [match URL];
NSLog(@"url:%@", url);
}
if (count == 0) *stop = YES;
if ([match resultType] == NSTextCheckingTypePhoneNumber) {
NSString *phoneNumber = [match phoneNumber];
NSLog(@"phoneNumber:%@", phoneNumber);
}
}];
三. 知識(shí)點(diǎn)分析
1.options參數(shù)
enumerateMatchesInString:range:usingBlock:的options參數(shù)官網(wǎng)demo寫的是0, 它有個(gè)枚舉:
-
NSMatchingReportProgress
: 網(wǎng)上說(shuō)是:找到最長(zhǎng)的匹 配字符串后調(diào)用block回調(diào).我實(shí)驗(yàn)后發(fā)現(xiàn)它進(jìn)入了很多很多次.... so 這個(gè)枚舉沒搞懂 -
NSMatchingReportCompletion
: 當(dāng)匹配都完成后,還會(huì)進(jìn)入一次block,匯報(bào)完成 -
NSMatchingAnchored
: 網(wǎng)上說(shuō):從匹配范圍的開始出進(jìn)行極限匹配 .我實(shí)驗(yàn)后一次都沒進(jìn)入 -
NSMatchingWithTransparentBounds
: 網(wǎng)上說(shuō):允許匹配的范圍超出設(shè)置的范圍. 實(shí)驗(yàn)后,正常,有幾次匹配就進(jìn)入幾次 -
NSMatchingWithoutAnchoringBounds
: 文檔說(shuō):禁止^和$自動(dòng)匹配開始和結(jié)束. 實(shí)驗(yàn)后,正常,有幾次匹配就進(jìn)入幾次
2. NSDataDetector的checkingTypes
上面是比較常用的匹配方式,細(xì)心的孩子肯定注意到,NSDataDetector可匹配的枚舉還有好多個(gè),是否每個(gè)都可用呢?
親身實(shí)驗(yàn),發(fā)現(xiàn)有的不行,運(yùn)行時(shí)程序會(huì)報(bào)錯(cuò)(no data detector types specified'),說(shuō)沒有這個(gè)枚舉
- NSTextCheckingTypeOrthography : 不可用
- NSTextCheckingTypeSpelling : 不可用
- NSTextCheckingTypeGrammar : 不可用
- NSTextCheckingTypeDate : 可用, 用法有
if ([match resultType] == NSTextCheckingTypeDate) {
NSDate *date = [match date];
NSLog(@"date:%@", date);
NSTimeZone * timezone = [match timeZone];
NSLog(@"time zone:%@", timezone);
CFTimeInterval duration = [match duration];
NSLog(@"duration:%f", duration);
}
- NSTextCheckingTypeAddress : 可用, 用法有:
if ([match resultType] == NSTextCheckingTypeAddress) {
NSDictionary<NSString *, NSString *> * addressComponent = [match addressComponents];
NSLog(@"城市:%@, 街道:%@", addressComponent[NSTextCheckingCityKey], addressComponent[NSTextCheckingStreetKey]);
}
- NSTextCheckingTypeLink : 可用 , 用法有:
if ([match resultType] == NSTextCheckingTypeLink) {
NSURL *url = [match URL];
NSLog(@"url:%@", url);
}
- NSTextCheckingTypeQuote : 不可用
- NSTextCheckingTypeDash : 不可用
- NSTextCheckingTypeReplacement : 不可用
- NSTextCheckingTypeCorrection : 不可用
- NSTextCheckingTypeRegularExpression : 不可用
- NSTextCheckingTypePhoneNumber : 可用 ,用法有:
if ([match resultType] == NSTextCheckingTypePhoneNumber) {
NSString *phoneNumber = [match phoneNumber];
NSLog(@"phoneNumber:%@", phoneNumber);
}
- NSTextCheckingTypeTransitInformation : 可用
好吧,總結(jié)出來(lái)就是:NSTextCheckingResult里面有對(duì)應(yīng)的屬性,那么這4種匹配就可用:URL,電話,日期,地址
下面是一個(gè)大神總結(jié)的具體的對(duì)應(yīng),相信大家一看就明白
Type | Properties | key值 |
---|---|---|
NSTextCheckingTypeDate | date, duration, timeZone | |
NSTextCheckingTypeAddress | addressComponents | NSTextCheckingNameKey, NSTextCheckingJobTitleKey, NSTextCheckingOrganizationKey, NSTextCheckingStreetKey, NSTextCheckingCityKey, NSTextCheckingStateKey, NSTextCheckingZIPKey, NSTextCheckingCountryKey, NSTextCheckingPhoneKey |
NSTextCheckingTypeLink | url | |
NSTextCheckingTypePhoneNumber | phoneNumber | |
NSTextCheckingTypeTransitInformation | components | NSTextCheckingAirlineKey, NSTextCheckingFlightKey |
奉送驗(yàn)證url方法:
-(BOOL) verifyURL{
NSString * string = @"http://www.reibang.com/users/72ee5da886ff/latest_articles";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink error:&error];
NSArray<NSTextCheckingResult *> * matches = [detector matchesInString:string options:0 range:NSMakeRange(0, [string length])];
if ([matches count] == 1 && matches[0].range.location == 0) {
return YES;
}
return NO;
}
網(wǎng)上說(shuō):
注意:驗(yàn)證URL鏈接更簡(jiǎn)單的辦法我們還可以借助系統(tǒng)提供的 canOpenURL() 方法來(lái)檢測(cè)一個(gè)鏈接的有效性淘菩,比如上面樣例可以改成如下的判斷方式:
private func verifyUrl(str:String) -> Bool { //創(chuàng)建NSURL實(shí)例
if let url = NSURL(string: str) { //檢測(cè)應(yīng)用是否能打開這個(gè)NSURL實(shí)例
return UIApplication.sharedApplication().canOpenURL(url)
}
return false
}
官網(wǎng)還告訴我們,解析自然語(yǔ)言用NSDataDetector.
如果文本已經(jīng)是一種特殊規(guī)范了,那么解析它們應(yīng)該用對(duì)應(yīng)的方式.比如 用DateFormatter來(lái)解析 ISO 8601的時(shí)間戳.
像機(jī)器識(shí)別的文本:XML或者json.應(yīng)該用 XMLParser
或者JSONSerialization來(lái)解析它們.
我寫的Demo
今天就到這里.最近好困,drinking coffee