本人Android開發(fā),某一天责掏,被告知自己程序URL的編碼中馏段,空格被轉換成了+轩拨,導致對方識別不成空格。當然我清楚的記得我是使用了URLEncoder的編碼和解碼方法院喜,并無其他操作亡蓉,而且這可是JDK提供的方法,因此我直接進行了測試
URLEncoder.encode("張三 媽媽","UTF-8")
其輸出結果為:%E5%BC%A0%E4%B8%89+%E5%A6%88%E5%A6%88
跟上面描述的現象一致够坐,按道理這里我門需要這個空格轉換成是%20才對
因此我嘗試了另外一個方法:Uri.encode("張三 媽媽")
Uri是Android SDK提供的方法寸宵,其輸出結果為:%E5%BC%A0%E4%B8%89%20%E5%A6%88%E5%A6%88
這就是我們預期的結果了。
但是如果不是Android開發(fā)元咙,沒有Uri這個類的支持該怎么辦呢梯影,查資料有人的做法是URLEncoder之后,替換所有的+為%20庶香,然后在URLDecoder甲棍,因為URLDecoder可以將+和%20轉換成空格。
后來我嘗試了很多在線的URL轉換工具赶掖,有些將空格轉換成了+有些轉換成了 %20感猛,當然直覺告訴我肯定不是誰對誰錯,肯定是標準不同或采用的語言差異等導致的奢赂,以下是引用別人的介紹:http://blog.csdn.net/foxpeter/article/details/23475293
一個URL的基本組成部分包括協(xié)議(scheme),域名陪白,端口號,路徑和查詢字符串(路徑參數和錨點標記就暫不考慮了)膳灶。路徑和查詢字符串之間用問號?分離咱士。例如http://www.example.com/index?param=1,路徑為index轧钓,查詢字符串(Query String)為param=1序厉。URL中關于空格的編碼正是與空格所在位置相關:空格被編碼成加號+的情況只會在查詢字符串部分出現,而被編碼成%20則可以出現在路徑和查詢字符串中毕箍。
造成這種混亂局面的原因在于:W3C標準規(guī)定弛房,當Content-Type為application/x-www-form-urlencoded時,URL中查詢參數名和參數值中空格要用加號+替代而柑,所以幾乎所有使用該規(guī)范的瀏覽器在表單提交后文捶,URL查詢參數中空格都會被編成加號+荷逞。而在另一份規(guī)范(RFC 2396,定義URI)里, URI里的保留字符都需轉義成%HH格式(Section 3.4 Query Component)粹排,因此空格會被編碼成%20颅围,加號+本身也作為保留字而被編成%2B,對于某些遵循RFC 2396標準的應用來說恨搓,它可能不接受查詢字符串中出現加號+,認為它是非法字符筏养。所以一個安全的舉措是URL中統(tǒng)一使用%20來編碼空格字符斧抱。
Java中的URLEncoder本意是用來把字符串編碼成application/x-www-form-urlencoded MIME格式字符串,也就是說僅僅適用于URL中的查詢字符串部分渐溶,但是URLEncoder經常被用來對URL的其他部分編碼辉浦,它的encode方法會把空格編成加號+,與之對應的是茎辐,URLDecoder的decode方法會把加號+和%20都解碼為空格宪郊,這種違反直覺的做法造成了當初我對空格URL編碼問題的困擾。因此后來我的做法都是拖陆,在調用URLEncoder.encode對URL進行編碼后(所有加號+已被編碼成%2B)弛槐,再調用replaceAll(“\+”, “%20″),將所有加號+替換為%20依啰。