为什么要做urlencode?

因为 url 对字符有限制,比如把一个邮箱放入 url,就需要使用 urlencode 函数,因为 url 中不能包含 @ 字符。

url转义其实也只是为了符合url的规范而已。因为在标准的url规范中中文和很多的字符是不允许出现在url中的。

看一下php的urlencode的说明:
urlencode — 编码 URL 字符串
string urlencode ( string $str )
返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 RFC1738 编码(参见 rawurlencode())不同。此函数便于将字符串编码并将其用于 URL 的请求部分,同时它还便于将变量传递给下一页。
哪些字符是需要转化的呢?
1. ASCII 的控制字符
这些字符都是不可打印的,自然需要进行转化。
2. 一些非ASCII字符
这些字符自然是非法的字符范围。转化也是理所当然的了。
3. 一些保留字符
很明显最常见的就是“&”了,这个如果出现在url中了,那你认为是url中的一个字符呢,还是特殊的参数分割用的呢?
4. 就是一些不安全的字符了。
例如:空格。为了防止引起歧义,需要被转化为“+”。
明白了这些,也就知道了为什么需要转化了,而转化的规则也是很简单的。

按照每个字符对应的字符编码,不是符合我们范围的,统统的转化为%的形式也就是了。自然也是16进制的形式。

和字符编码无关
通过urlencode的转化规则和目的,我们也很容易的看出,urleocode是基于字符编码的。同样的一个汉字,不同的编码类型,肯定对应不同的urleocode的串。gbk编码的有gbk的encode结果。
apache等服务器,接受到字符串后,可以进行decode,但是还是无法解决编码的问题。编码问题,还是需要靠约定或者字符编码的判断解决。
因此,urleocode只是为了url中一些非ascii字符,可以正确无误的被传输,至于使用哪种编码,就不是encode所关心和解决的问题了。
编码问题,不是urlencode所要解决的。

8 Comments

  1. Awesome post! Keep up the great work! 🙂

  2. Great content! Super high-quality! Keep it up! 🙂

  3. Artikkelen din er verdt å lese.

  4. Nice artigo! Obrigado.. Nike Petr Karb

  5. C’est vraiment intéressant, vous êtes un blogueur très compétent. J’ai rejoint votre flux rss et je suis impatient de chercher plus de votre merveilleux message. Aussi, j’ai partagé votre site web dans mes réseaux sociaux! Lynnet Roddie Kristel

  6. Esta debe ser la mejor colección de blogs sitio web que he encontrado a cabo. Amie Jerri Burns

  7. Hallo, es ist immer toll, andere Menschen bei meiner Suche durch die ganze Welt zu sehen. Ich schätze die Zeit sehr, die es hätte brauchen müssen, um diesen großartigen Artikel zusammenzustellen. Prost
    Clerissa Fran Wivestad

  8. I adore examining and I conceive this website got some genuinely utilitarian stuff on it! . Storm Lynn Sherburne

发表评论

电子邮件地址不会被公开。 必填项已用*标注