MD5 這種加密算法應該屬于每天都要被用到的東西,然而,iOS 只提供了這個方法給我們使用兜看。
extern unsigned char *CC_MD5(const void *data, CC_LONG len, unsigned char *md)
于是共屈,在這個方法下面 我發(fā)現(xiàn)了各種坑
先開看看 NSString 的 MD5 Category:
import "NSString+Md5.h"
import <CommonCrypto/CommonCrypto.h>
@implementation NSString (Md5)
-
(NSString *)md5String
{
const char *str = [(NSString *)self UTF8String];unsigned char result[CC_MD5_DIGEST_LENGTH] = {0};
CC_MD5(str, (CC_LONG)strlen(str), result);NSMutableString *ret = [NSMutableString string];
for (int i = 0; i < CC_MD5_DIGEST_LENGTH; i++) {
[ret appendFormat:@"%02x", result[i]];
}return ret;
}
@end
對于 NSData 的一個 Category:
import "NSData+Md5.h"
import <CommonCrypto/CommonCrypto.h>
@implementation NSData (Md5)
-
(NSString *)md5String
{
const char *str = [self bytes];
unsigned char result[CC_MD5_DIGEST_LENGTH];
CC_MD5(str, (CC_LONG)self.length, result);NSMutableString *hash = [NSMutableString string];
for (int i = 0; i < CC_MD5_DIGEST_LENGTH; i++) {
[hash appendFormat:@"%02X", result[i]];
}return [hash lowercaseString];
}
@end
粗略一看 也許這2個 Category 只是 NSString 和 NSData 的區(qū)別,本質(zhì)區(qū)別并不大今瀑。但是 程梦。点把。你注意到了嗎?對于 NSString 在使用 CC_MD5 函數(shù)的時候,傳入的參數(shù)是 strlen(str),對于 NSData 傳入的參數(shù)是 self.length,一個使用了 C 的方法,一個使用了 Objective-C 的方法作烟。這是一個大坑愉粤。。如果稍不注意就會掛拿撩。衣厘。而且。压恒。根本查不到問題的所在影暴。。 Why探赫?
讓我們先看看 NSString型宙,由于 CC_MD5 是一個 C 的函數(shù),但是 在使用 NSString 的時候伦吠,NSString 的 length 函數(shù)對字符轉(zhuǎn)義進行過了處理妆兑,對于普通的字符并沒有太大的區(qū)別,但是 遇到中文的時候就要跪了毛仪,讓我們看看下面的例子
NSString *test = @"我";
NSLog(@"%lu",(unsigned long)test.length);
const char *cTest = [test UTF8String];
NSLog(@"%lu",strlen(cTest));
前者輸出了 1 后者輸出了 3搁嗓, 這其實是很正常的現(xiàn)象,因為一個中文占了3個字節(jié),蘋果對 length 進行了處理箱靴,所以腺逛,在使用 length 的時候,你獲取到的漢字的長度是1衡怀,讓我們在看看這個例子:
NSLog(@"%c",[test characterAtIndex:0]);
NSLog(@"%@",[test substringWithRange:NSMakeRange(0, 1)]);
相信很多人也都踩過這個坑 蘋果文檔中還特意聲明 Use with rangeOfComposedCharacterSequencesForRange: to avoid breaking up composed characters , 使用這個方法可以避免字符串被中間切斷棍矛,也就是在上面兩個NSLog中,前者輸入了亂碼抛杨,后者輸出了漢字“我”.
好了够委,這個坑的解釋基本就到這里了,在使用 NSString 的時候蝶桶,因為 CC_MD5 是一個C函數(shù),而 NSString 提供的 length 函數(shù)被處理過后慨绳,漢字或者一些其他鬼字符的長度和 strlen 計算出來的不一樣了,于是導致了這樣一個大坑真竖。
接下來脐雪,我們看看 NSData,在 NSData 中恢共,我們計算 CC_MD5 的時候战秋,傳入的長度是 self.length,而不再是 strlen() 計算出來的, 讓我們看看下面的例子:
NSString *test = @"aaa\0bbb";
NSLog(@"%lu",(unsigned long)test.length);
const char *cTest = [test UTF8String];
NSLog(@"%lu",strlen(cTest));
前者輸出了7 后者只輸出了3讨韭,原因是 char 的數(shù)組在遇到'\0'的時候脂信,認為這個字符串已經(jīng)結(jié)束了癣蟋,因此 將不在對 bbb 做處理了,而用 strlen 計算出來的長度只有3了。到這里 你甚至可能會和我一樣疑惑狰闪,按照這樣的說法疯搅,上述用 NSString 傳入計算 MD5 的長度正確嗎?我只能說 幸運的是在正常的 NSString 中 我們不會出現(xiàn)'\0'這樣的變態(tài)字符埋泵,除非是你自己刻意去拼出一個這樣的字符.
接下來該回到 NSData 了幔欧,會用 NSData 去計算 MD5 通常是通過文件或者音頻、圖片等轉(zhuǎn)化過來的丽声,因此礁蔗,在 data 中什么都有可能出現(xiàn),如果我沒有記錯的話,字符'\0'被轉(zhuǎn)化成二進制應該是 0000 00000之類的東西雁社,這時候浴井,如果你的 NSData 是通過壓縮或者其他方式得到的,就很有可能出現(xiàn)一個這樣的二進制 .....0000......(意思就是 二進制的一串中包含了一些特殊的字符,相當于轉(zhuǎn)化成String被識別成了'\0'),于是 這時候霉撵,你再用strlen計算磺浙,就只會計算.....0000這么多了,后面的就完全忽略了徒坡,于是 這樣一個潛在的bug就出現(xiàn)了屠缭。 舉個例子來說:我們分別利用 NSString 和將 String 轉(zhuǎn)化為 NSData 的字符串@“aaa”去計算各自的 MD5
NSString *test = @"aaa";
NSLog(@"%@",[test md5StringStr]);
NSData *data = [test dataUsingEncoding:NSUTF8StringEncoding];
NSLog(@"%@",[data md5String]);
計算出來的結(jié)果一樣 都是 47bce5c74f589f4867dbd57e9ca9f808
但是 當我們把字符串改成@"aaa\0bbb" ('\0')起到了決定性的因素
NSString *test = @"aaa\0bbb";
NSLog(@"%@",[test md5StringStr]);
NSData *data = [test dataUsingEncoding:NSUTF8StringEncoding];
NSLog(@"%@",[data md5String]);
在看看結(jié)果 NSString 算出來的是 47bce5c74f589f4867dbd57e9ca9f808(和上面的一樣), 但是 NSData 算出來的是 ea21d344ad21e7cc63e5d4480f76dc83,這時候 你看出區(qū)別了把崭参,兩個不同的字符串,用NSString 那個 Category 方法算出來的結(jié)果是一樣的款咖,但是 用N SData 那個 Category 算出來卻有了明顯的區(qū)別何暮,到底哪個正確,你應該可以自己判斷了把铐殃。
在正常的情況下海洼,我們習慣于去寫 NSString 那個 Category 的 MD5,因為在正常的情況下富腊,用它計算出來的結(jié)果都是正確的坏逢,但是 如果你自己去拼接一種帶有'\0'的特殊字符串,那么這樣計算出來的 MD5 結(jié)果就出現(xiàn)了問題赘被;另外是整,由于 NSData 通常是由你的圖片或者音頻等轉(zhuǎn)化過來的,所以 你使用NSData計算MD5帶入的二進制很有可能直接包含了'\0'等變態(tài)字符民假,這時候浮入,使用NSData的length方法可以有效的避免這個問題。
所以羊异,在我看來最安全的 MD5 計算方法應該是將 NSString 轉(zhuǎn)化為 NSData事秀,然后通過 NSData 去計算彤断,代碼如下(還是2個 Category):
//NSData 的 MD5 方法不變
import "NSData+Md5.h"
import <CommonCrypto/CommonCrypto.h>
@implementation NSData (Md5)
-
(NSString *)md5String
{
const char *str = [self bytes];
unsigned char result[CC_MD5_DIGEST_LENGTH];
CC_MD5(str, (CC_LONG)self.length, result);NSMutableString *hash = [NSMutableString string];
for (int i = 0; i < CC_MD5_DIGEST_LENGTH; i++) {
[hash appendFormat:@"%02X", result[i]];
}return [hash lowercaseString];
}
@end
//NSString 的 MD5 轉(zhuǎn)化為 NSData,通過 NSData 的 MD5 計算返回結(jié)果
import "NSString+Md5.h"
import "NSData+Md5.h"
@implementation NSString (Md5)
- (NSString *)md5String
{
NSData *data = [self dataUsingEncoding:NSUTF8StringEncoding];
return [data md5String];
}
@end