一. NSDataDetector介紹
NSDataDetector 是繼承于 NSRegularExpression 的一個子類屠凶。使用的時候只需要指定要匹配的類型(日期砌创、地址、URL等)就可以提取的想要的信息翁潘,而不需要自己再寫復(fù)雜的表達(dá)式哀九。
蘋果對一些常用的正則匹配都作了封裝,如時間,時區(qū),網(wǎng)頁鏈接url,電話號碼等等,而且這些識別是國際化的,比如中國的手機(jī)號是13044345467,XX國的手機(jī)號是932-23333222,它都可以識別.又比如中國人的名字是王大明,英國人的名字是 William Jafferson Clinton,也都能識別.
我們不用自己去寫正則表達(dá)式匹配,而采用NSDataDetector.
閱讀它的描述已經(jīng)能獲取大多數(shù)信息.
二. 使用方法:
1. 使用NSRegularExpression的方法.
作為NSRegularExpression的子類,它可使用其所有方法.numberOfMatchesInString:options:range就是其一,查看一共有多少匹配項.還有matches(in:options:range:)和firstMatch(in:options:range:)
NSString * string = @"歡迎訪問http://www.111cn.net,https://111cn.net\n以及ftp://111cn.net";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypePhoneNumber| NSTextCheckingTypeLink error:&error];
NSUInteger numberOfMatches = [detector numberOfMatchesInString:string
options:0
range:NSMakeRange(0, [string length])];
2. 這是matches(in:options:range:)的用法:
NSString * string = @"歡迎訪問http://www.reibang.com/users/72ee5da886ff/latest_articles. 咱的電話是012-1304445928.ps:電話隨便寫的喲.今天是2016-10-25,天氣(weather)不錯";
NSString * string = @"歡迎訪問http://www.reibang.com/users/72ee5da886ff/latest_articles. 咱的電話是012-1304445928.ps:電話隨便寫的喲.今天是2016-10-25,天氣(weather)不錯";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink|NSTextCheckingTypePhoneNumber error:&error];
NSArray *matches = [detector matchesInString:string
options:0
range:NSMakeRange(0, [string length])];
for (NSTextCheckingResult *match in matches) {
NSRange matchRange = [match range];
if ([match resultType] == NSTextCheckingTypeLink) {
NSURL *url = [match URL];
NSLog(@"url:%@", url);
} else if ([match resultType] == NSTextCheckingTypePhoneNumber) {
NSString *phoneNumber = [match phoneNumber];
NSLog(@"phoneNumber:%@", phoneNumber);
}
}
3.塊是另一種形式,比較靈活和高效.
為何?因為它是每找到一個match,就進(jìn)入塊一次.
比如一共有4個match,它就會進(jìn)入4次塊.
所以你可以用塊的參數(shù)stop控制這個塊.如果你已經(jīng)找到需要的match,就設(shè)置stop為YES,就不會繼續(xù)找match了.
NSString * string = @"歡迎訪問http://www.reibang.com/users/72ee5da886ff/latest_articles. 咱的電話是012-1304445928.ps:電話隨便寫的喲.今天是2016-10-25,天氣(weather)不錯";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink|NSTextCheckingTypePhoneNumber error:&error];
__block NSUInteger count = 0;
[detector enumerateMatchesInString:string options:0 range:NSMakeRange(0, [string length]) usingBlock:^(NSTextCheckingResult * _Nullable match, NSMatchingFlags flags, BOOL * _Nonnull stop) {
NSLog(@"flag:%lu",(unsigned long)flags);
NSRange matchRange = [match range];
if ([match resultType] == NSTextCheckingTypeLink) {
NSURL *url = [match URL];
NSLog(@"url:%@", url);
}
if (count == 0) *stop = YES;
if ([match resultType] == NSTextCheckingTypePhoneNumber) {
NSString *phoneNumber = [match phoneNumber];
NSLog(@"phoneNumber:%@", phoneNumber);
}
}];
三. 知識點分析
1.options參數(shù)
enumerateMatchesInString:range:usingBlock:的options參數(shù)官網(wǎng)demo寫的是0, 它有個枚舉:
-
NSMatchingReportProgress
: 網(wǎng)上說是:找到最長的匹 配字符串后調(diào)用block回調(diào).我實驗后發(fā)現(xiàn)它進(jìn)入了很多很多次.... so 這個枚舉沒搞懂 -
NSMatchingReportCompletion
: 當(dāng)匹配都完成后,還會進(jìn)入一次block,匯報完成 -
NSMatchingAnchored
: 網(wǎng)上說:從匹配范圍的開始出進(jìn)行極限匹配 .我實驗后一次都沒進(jìn)入 -
NSMatchingWithTransparentBounds
: 網(wǎng)上說:允許匹配的范圍超出設(shè)置的范圍. 實驗后,正常,有幾次匹配就進(jìn)入幾次 -
NSMatchingWithoutAnchoringBounds
: 文檔說:禁止^和$自動匹配開始和結(jié)束. 實驗后,正常,有幾次匹配就進(jìn)入幾次
2. NSDataDetector的checkingTypes
上面是比較常用的匹配方式,細(xì)心的孩子肯定注意到,NSDataDetector可匹配的枚舉還有好多個,是否每個都可用呢?
親身實驗,發(fā)現(xiàn)有的不行,運行時程序會報錯(no data detector types specified'),說沒有這個枚舉
- NSTextCheckingTypeOrthography : 不可用
- NSTextCheckingTypeSpelling : 不可用
- NSTextCheckingTypeGrammar : 不可用
- NSTextCheckingTypeDate : 可用, 用法有
if ([match resultType] == NSTextCheckingTypeDate) {
NSDate *date = [match date];
NSLog(@"date:%@", date);
NSTimeZone * timezone = [match timeZone];
NSLog(@"time zone:%@", timezone);
CFTimeInterval duration = [match duration];
NSLog(@"duration:%f", duration);
}
- NSTextCheckingTypeAddress : 可用, 用法有:
if ([match resultType] == NSTextCheckingTypeAddress) {
NSDictionary<NSString *, NSString *> * addressComponent = [match addressComponents];
NSLog(@"城市:%@, 街道:%@", addressComponent[NSTextCheckingCityKey], addressComponent[NSTextCheckingStreetKey]);
}
- NSTextCheckingTypeLink : 可用 , 用法有:
if ([match resultType] == NSTextCheckingTypeLink) {
NSURL *url = [match URL];
NSLog(@"url:%@", url);
}
- NSTextCheckingTypeQuote : 不可用
- NSTextCheckingTypeDash : 不可用
- NSTextCheckingTypeReplacement : 不可用
- NSTextCheckingTypeCorrection : 不可用
- NSTextCheckingTypeRegularExpression : 不可用
- NSTextCheckingTypePhoneNumber : 可用 ,用法有:
if ([match resultType] == NSTextCheckingTypePhoneNumber) {
NSString *phoneNumber = [match phoneNumber];
NSLog(@"phoneNumber:%@", phoneNumber);
}
- NSTextCheckingTypeTransitInformation : 可用
好吧,總結(jié)出來就是:NSTextCheckingResult里面有對應(yīng)的屬性,那么這4種匹配就可用:URL,電話,日期,地址
下面是一個大神總結(jié)的具體的對應(yīng),相信大家一看就明白
Type | Properties | key值 |
---|---|---|
NSTextCheckingTypeDate | date, duration, timeZone | |
NSTextCheckingTypeAddress | addressComponents | NSTextCheckingNameKey, NSTextCheckingJobTitleKey, NSTextCheckingOrganizationKey, NSTextCheckingStreetKey, NSTextCheckingCityKey, NSTextCheckingStateKey, NSTextCheckingZIPKey, NSTextCheckingCountryKey, NSTextCheckingPhoneKey |
NSTextCheckingTypeLink | url | |
NSTextCheckingTypePhoneNumber | phoneNumber | |
NSTextCheckingTypeTransitInformation | components | NSTextCheckingAirlineKey, NSTextCheckingFlightKey |
奉送驗證url方法:
-(BOOL) verifyURL{
NSString * string = @"http://www.reibang.com/users/72ee5da886ff/latest_articles";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink error:&error];
NSArray<NSTextCheckingResult *> * matches = [detector matchesInString:string options:0 range:NSMakeRange(0, [string length])];
if ([matches count] == 1 && matches[0].range.location == 0) {
return YES;
}
return NO;
}
網(wǎng)上說:
注意:驗證URL鏈接更簡單的辦法我們還可以借助系統(tǒng)提供的 canOpenURL() 方法來檢測一個鏈接的有效性戒财,比如上面樣例可以改成如下的判斷方式:
private func verifyUrl(str:String) -> Bool { //創(chuàng)建NSURL實例
if let url = NSURL(string: str) { //檢測應(yīng)用是否能打開這個NSURL實例
return UIApplication.sharedApplication().canOpenURL(url)
}
return false
}
官網(wǎng)還告訴我們,解析自然語言用NSDataDetector.
如果文本已經(jīng)是一種特殊規(guī)范了,那么解析它們應(yīng)該用對應(yīng)的方式.比如 用DateFormatter來解析 ISO 8601的時間戳.
像機(jī)器識別的文本:XML或者json.應(yīng)該用 XMLParser
或者JSONSerialization來解析它們.
參考文章:
NSDataDetector官網(wǎng)文檔
Swift中利用NSDataDetector提取字符串中所有鏈接(URL驗證)
Stackorverflow
NSDataDetector取代iOS的某些正則表達(dá)式:URL,電話,日期,地址