PHP中對于URL進行編碼,可以使用 urlencode() 或者 rawurlencode()捆交,二者的區(qū)別是前者把空格編碼為 '+'茧妒,而后者把空格編碼為 '%20'姿骏,不過應(yīng)該注意的是身笤,在編碼時應(yīng)該只對部分URL編碼豹悬,否則URL中的冒號和反斜杠也會被轉(zhuǎn)義。下面是詳細解釋:
string urlencode ( string str)
返回字符串液荸,此字符串中除了 -. 之外的所有非字母數(shù)字字符都將被替換成百分號(%)后跟兩位十六進制數(shù)瞻佛,空格則編碼為加號(+)。此編碼與 WWW 表單 POST 數(shù)據(jù)的編碼方式是一樣的娇钱,同時與 application/x-www-form-urlencoded 的媒體類型編碼方式一樣伤柄。由于歷史原因绊困,此編碼在將空格編碼為加號(+)方面與 RFC1738 編碼(參見 rawurlencode())不同。此函數(shù)便于將字符串編碼并將其用于 URL 的請求部分适刀,同時它還便于將變量傳遞給下一頁: 例子 1. urlencode() 示例
復(fù)制代碼 代碼如下:
<?php echo '<a href="mycgi?foo=', urlencode($userinput), '">'; ?>
注意:小心與 HTML 實體相匹配的變量秤朗。像 &、? 和 £ 都將被瀏覽器解析蔗彤,并使用實際實體替代所期待的變量名。這是明顯的混亂疯兼,W3C 已經(jīng)告誡人們好幾年了然遏。參考地址:http://www.w3.org/TR/html4/appendix/notes.html#h-B.2.2 PHP 通過 arg_separator .ini 指令,支持將參數(shù)分割符變成 W3C 所建議的分號吧彪。不幸的是大多數(shù)用戶代理并不發(fā)送分號分隔符格式的表單數(shù)據(jù)待侵。較為簡單的解決辦法是使用 & 代替 & 作為分隔符。你不需要為此修改 PHP 的 arg_separator姨裸。讓它仍為 &秧倾,而僅使用 htmlentities(urlencode($data)) 對你的 URL 進行編碼。
例子 2. urlencode() 與 htmlentities() 示例
復(fù)制代碼 代碼如下:
<?php echo '<a href="mycgi?foo=', htmlentities(urlencode($userinput)), '">'; ?>
string urlencode ( string str)
返回字符串傀缩,此字符串中除了 -. 之外的所有非字母數(shù)字字符都將被替換成百分號(%)后跟兩位十六進制數(shù)那先。這是在 RFC 1738 中描述的編碼,是為了保護原義字符以免其被解釋為特殊的 URL 定界符赡艰,同時保護 URL 格式以免其被傳輸媒體(像一些郵件系統(tǒng))使用字符轉(zhuǎn)換時弄亂售淡。例如,如果你想在 FTP 的 URL 中包含密碼:
例子 1. rawurlencode() 示例 1
復(fù)制代碼 代碼如下:
<?php echo '<a href="ftp://user:', rawurlencode('foo @+%/'), '@ftp.my.com/x.txt">'; ?>
或者慷垮,如果你想通過 URL 的 PATH_INFO 構(gòu)成部分去傳遞信息:
例子 2. rawurlencode() 示例 2
復(fù)制代碼 代碼如下:
<?php echo '<a , rawurlencode('sales and marketing/Miami'), '">'; ?>
在解碼時揖闸,可以使用相應(yīng)的 urldecode() 和 rawurldecode(),相應(yīng)地料身,rawurldecode() 不會把加號('+')解碼為空格汤纸,而 urldecode() 可以。 下面是詳細示例:
string urldecode ( string str)
解碼給出的已編碼字符串中的任何 %##芹血。返回解碼后的字符串贮泞。 例子 1. urldecode() example
復(fù)制代碼 代碼如下:
<?php $a = explode('&', $QUERY_STRING); $i = 0; while ($i < count($a)) { $b = split('=', $a[$i]); echo 'Value for parameter ', htmlspecialchars(urldecode($b[0])), ' is ', htmlspecialchars(urldecode($b[1])), "<br />n"; $i++; } ?>
string rawurldecode ( string str)
返回字符串,此字符串中百分號(%)后跟兩位十六進制數(shù)的序列都將被替換成原義字符幔烛。
例子 1. rawurldecode() 示例
復(fù)制代碼 代碼如下:
<?php echo rawurldecode('foo%20bar%40baz'); // foo bar@baz ?>
但是隙畜,有一點需要注意的地方是,urldecode() 和 rawurldecode() 解碼出的字符串是 UTF-8格式的編碼说贝,如果URL中含有中文的話议惰,而頁面設(shè)置又不是 UTF-8 的話,則要把解碼出的字符串進行轉(zhuǎn)換乡恕,才能正常顯示言询!
還有一個問題俯萎,就是所獲得的 URL 不是 %%nn n={0..F} 的格式,而是 %unnnn n={0..F} 的格式运杭,這時候再使用 urldecode() 和 rawurldecode() 是無法正確解碼的夫啊,而要用下面這個函數(shù)才能正確解碼:
復(fù)制代碼 代碼如下:
function utf8RawUrlDecode ($source) { $decodedStr = ""; $pos = 0; $len = strlen ($source); while ($pos < $len) { $charAt = substr ($source, $pos, 1); if ($charAt == '%') { $pos++; $charAt = substr ($source, $pos, 1); if ($charAt == 'u') { // we got a unicode character $pos++; $unicodeHexVal = substr ($source, $pos, 4); $unicode = hexdec ($unicodeHexVal); $entity = "&#". $unicode . ';'; $decodedStr .= utf8_encode ($entity); $pos += 4; } else { // we have an escaped ascii character $hexVal = substr ($source, $pos, 2); $decodedStr .= chr (hexdec ($hexVal)); $pos += 2; } } else { $decodedStr .= $charAt; $pos++; } } return $decodedStr; }
問題:2個函數(shù)都是針對字符串轉(zhuǎn)義使其適合做文件名。該用哪個辆憔?哪個更標(biāo)準撇眯?
結(jié)論:
rawurlencode遵守是94年國際標(biāo)準備忘錄RFC 1738,
urlencode實現(xiàn)的是傳統(tǒng)做法虱咧,和上者的主要區(qū)別是對空格的轉(zhuǎn)義是'+'而不是'%20'
javascript的encodeURL也是94年標(biāo)準熊榛,
而javascript的escape是另一種用"%xxx"標(biāo)記unicode編碼的方法。
推薦在PHP中使用用rawurlencode腕巡。棄用urlencode
樣例
source:
超級無敵的人sadha sajdh數(shù)據(jù)樣本sdls fhejrthcxzb.file.jpeg
PHP urlencode:
%E8%B6%85%E7%BA%A7%E6%97%A0%E6%95%8C%E7%9A%84%E4%BA%BAsadha+sajdh%E6%95%B0%E6%8D%AE%E6%A0%B7%E6%9C%ACsdls+fhejrthcxzb.file.jpeg
PHP rawurlencode:
%E8%B6%85%E7%BA%A7%E6%97%A0%E6%95%8C%E7%9A%84%E4%BA%BAsadha%20sajdh%E6%95%B0%E6%8D%AE%E6%A0%B7%E6%9C%ACsdls%20fhejrthcxzb.file.jpeg
Javascript encodeURI:
%E8%B6%85%E7%BA%A7%E6%97%A0%E6%95%8C%E7%9A%84%E4%BA%BAsadha%20sajdh%E6%95%B0%E6%8D%AE%E6%A0%B7%E6%9C%ACsdls%20fhejrthcxzb.file.jpeg
Javascript escape:
%u8D85%u7EA7%u65E0%u654C%u7684%u4EBAsadha%20sajdh%u6570%u636E%u6837%u672Csdls%20fhejrthcxzb.file.jpeg