中文在URL中的编码

最新推荐文章于 2024-09-26 11:01:02 发布

kubernetes-k8s

最新推荐文章于 2024-09-26 11:01:02 发布

阅读量2.5k

点赞数 2

分类专栏：搜索技术文章标签： url string google byte c# yahoo

本文链接：https://blog.csdn.net/guofangsky/article/details/1451865

版权

搜索技术专栏收录该内容

30 篇文章

订阅专栏

问题来源：
正在研究一个程序，输入一个关键字，能够把这个关键字发送到Google，yahoo等搜索引擎，进行搜索，然后打开结果网页。原理很简单。比如在Google搜索China，搜索结果页面的URL就是“http://www.google.com/search?hl=zh-CN&q=China&lr=”。只要替换红颜色的内容，就可以按照不同的关键字搜索。

但是如果关键字是中文，就会出现问题。比如在google搜索“中国”，Url是“http://www.google.com/search?hl=zh-CN&newwindow=1&q=%E4%B8%AD%E5%9B%BD&lr=”。汉字“中国”被按照UTF-8的格式进行编码。

不仅汉字进行编码，一些特殊字符也会进行编码。比如搜索“C#”，URL是“http://www.google.com/search?hl=zh-CN&newwindow=1&q=C%23&lr=”。

一般来说，国外的网站都是按照UTF-8编码，而“百度”是按照“GB2312”进行编码的。比如搜索“中国”，URL是“http://www.baidu.com/s?wd=%D6%D0%B9%FA&cl=3”

我们对比一下：C#中国的编码