现在的位置: 首页 > 综合 > 正文

PHP中urlencode和rawurlencode的区别

2012年09月05日 ⁄ 综合 ⁄ 共 1343字 ⁄ 字号 评论关闭

昨天看UCHome源码的时候,发现有些地方用urlencode,有些地方用rawurlencode。由于对这两个方法的差异不是很清楚,特意写了一段代码来测试。

请将下面的代码保存到一个PHP文件中:

<?php  
test_encode('http://www.baidu.com?a=search&k=eclipse');  
test_encode(':/?= &#');  
test_encode('中文');  
function test_encode($s)  
{  
  echo "<b>urlencode('$s')</b> = [<b>";  
  var_dump(urlencode($s));    
  echo "</b>]<br/>";  
  echo "<b>rawurlencode('$s')</b> = [<b>";  
  var_dump(rawurlencode($s));    
  echo "</b>]<br/>";  
} 

 

上面代码执行结果如下:

urlencode('http://www.baidu.com?a=search&k=eclipse') = [string(53) "http%3A%2F%2Fwww.baidu.com%3Fa%3Dsearch%26k%3Declipse" ]  
rawurlencode('http://www.baidu.com?a=search&k=eclipse') = [string(53) "http%3A%2F%2Fwww.baidu.com%3Fa%3Dsearch%26k%3Declipse" ]  
urlencode(':/?= &#') = [string(19) "%3A%2F%3F%3D+%26%23" ]  
rawurlencode(':/?= &#') = [string(21) "%3A%2F%3F%3D%20%26%23" ]  
urlencode('中文') = [string(18) "%E4%B8%AD%E6%96%87" ]  
rawurlencode('中文') = [string(18) "%E4%B8%AD%E6%96%87" ]  

 

从上面的执行结果可以看出,urlencode和rawurlencode两个方法在处理字母数字,特殊符号,中文的时候结果都是一样的,唯一的不同是对空格的处理,urlencode处理成“+”,rawurlencode处理成“%20”。

看看PHP Manual对两个函数的说明:
urlencode:返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 RFC1738 编码(参见 rawurlencode())不同。
rawurlencode:返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数。这是在 RFC 1738 中描述的编码,是为了保护原义字符以免其被解释为特殊的 URL 定界符,同时保护 URL 格式以免其被传输媒体(像一些邮件系统)使用字符转换时弄乱。

抱歉!评论已关闭.