html参数编码详解编程语言
1.html页面代码如下:
!DOCTYPE html PUBLIC -//W3C//DTD XHTML 1.0 Transitional//EN http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd
html xmlns= http://www.w3.org/1999/xhtml
head
meta http-equiv= Content-Type content= text/html; charset=utf-8 /
title 传递页 /title
/head
body
script language= javascript
document.write( a href= 2.html?key= +encodeURIComponent( 房屋信息 )+ 房屋信息 /a );
/script
/body
/html
2.html页面代码如下:
!DOCTYPE html PUBLIC -//W3C//DTD XHTML 1.0 Transitional//EN http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd
html xmlns= http://www.w3.org/1999/xhtml
head
meta http-equiv= Content-Type content= text/html; charset=utf-8 /
title 获取页 /title
/head
body
Script language= javascript
function GetRequest() {
var url = location.search; //获取url中 ? 符后的字串
var theRequest = new Object();
if (url.indexOf( ? ) != -1) {
var str = url.substr(1);
strs = str.split( );
for(var i = 0; i strs.length; i ++) {
theRequest[strs[i].split( = )[0]]=decodeURIComponent(strs[i].split( = )[1]);
}
}
return theRequest;
}
/Script
Script language= javascript
var Request = new Object();
Request = GetRequest();
var key1;
key = Request[ key ];
document.write(key);
/Script
/body
/html
以下是JS重写title代码:
script type= text/javascript
!
var t=document.title;
var mytitle=key+ _
document.title=mytitle+t;
//
/script
我们经常要在页面传递中文数据,但是往往被文字编码所困惑.有时不了解到底是浏览器编码问题还是服务器编码问题.本文分析了互联网传递数据的编码原理, 并且提出了完善易用的解决方案.
避免在get或者post参数时直接传递中文字符.中文参数需要经过编码后再传递.服务器端要使用相同的编码格式进行解码
三.错误观点
1.很多程序员认为url中可以传递中文.
url中并不能携带中文参数.如果我们在浏览器中输入 http://localhost/?a=中文 ,感觉上我们在url中带了中文,实际上当按下回车键后,浏览器自动将其中的 中文 汉字进行编码后传递给服务器.
2.当获取中文参数产生了乱码时, 往往首先检查服务器端程序的编码格式.
很多人认为url可以传递中文,不知道浏览器有自动编码的行为, 所以单纯的认为问题出在服务器端.其实即使在服务器端找到了正确的编码格式,我们也不应该轻易地改变服务器的默认编码格式.
3.传递参数前编码,使用Request对象获取参数时解码
很多的程序员认为认为,传递参数时我们使用UrlEncode等方式编码, 在接收时应该使用UrlDecode解码.这是常见的错误请大家一定要注意,使用默认的Request.QueryString和Request.Form时已经自动执行了一次解码,使用的解码格式是服务器端设置的默认编码格式.
传递中文字符时,自动的编码解码格式和浏览器与服务器的设置有关.
测试Firefox3和IE6的Get方式发送中文参数, Firefox默认使用UTF-8格式编码中文参数, 而IE6即使在高级设置中设置了 总是以 UTF-8 发送URL , 仍然自动使用GB2312编码中文参数.
对于服务器端我们可以自由的控制解码的格式.但是往往是通过更改服务器配置进行全局的统一设置.比如对于ASP.NET程序.可以在Web.Config中设置服务器段的编码和解码格式:
globalization culture= zh-CN uiCulture= zh-CN requestEncoding= UTF-8 responseEncoding= gb2312 /
但是我们没法控制浏览器端行为.用户可能使用不同的浏览器.
五.解决方案 1.统一默认的编码格式(1)设置服务器端的编码格式为UTF-8
(2)传递参数全部进行编码,.服务器端(C#)使用Server.UrlEncode方法,客户端(javascript)使用encodeURIComponent方法.
说明:
客户端的javascript函数encodeURIComponent只能使用UTF-8编码格式. 所以需要设置服务器端request和response都为UTF-8.
缺陷是如果某些合作伙伴必须传递其他的编码格式的参数, 则服务器端或获取到乱码.此方案实现简单,适合大部分场景.
2.通过编码参数指定编码格式为了解决可能存在的无法统一编码格式的问题, 我们使用一个参数 encoding 来显示的指定编码格式.encoding参数需要在所有的请求中传递,无论是get还是post.
(1)对于javascript客户端编码而言, 仍然使用encodeURIComponent方法编码, 此时指定encoding参数的值为 UTF-8 .
(2) 对于传入给服务器端的其他编码格式, 比如GB2312, 我们不能使用默认的Request.Form或者QueryString方法进行编码.因为服务器端的编码格式可能设置为了UTF-8.此时使用 Request.Form或者QueryString会自动使用服务器端指定的编码格式进行解码. 所以需要使用下面的方法自己处理请求,获取参数:
/// summary /// 根据指定的编码格式返回请求的参数集合 ziqiu.zhang 2009.1.19 /// /summary /// param name="request" 当前请求的request对象 /param /// param name="encode" 编码格式字符串 /param /// returns 键为参数名,值为参数值的NameValue集合 /returns public static NameValueCollection GetRequestParameters(HttpRequest request, string encode) NameValueCollection result = null; Encoding destEncode = null; //获取指定编码格式的Encoding对象 if (!String.IsNullOrEmpty(encode)) try //获取指定的编码格式 destEncode = Encoding.GetEncoding(encode); catch //如果获取指定编码格式失败,则设置为null destEncode = null; //根据不同的HttpMethod方式,获取请求的参数.如果没有Encoding对象则使用服务器端默认的编码. if (request.HttpMethod == "POST") if (null != destEncode) Stream resStream = request.InputStream; byte[] filecontent = new byte[resStream.Length]; resStream.Read(filecontent, 0, filecontent.Length); string postquery = destEncode.GetString(filecontent); result = HttpUtility.ParseQueryString(postquery, destEncode); else result = request.Form; else if (null != destEncode) result = System.Web.HttpUtility.ParseQueryString(request.Url.Query, destEncode); else result = request.QueryString; //返回结果 return result; }
通过上面的方法, 无论是Get请求还是Post请求, 我们都可以使用自己指定的编码格式获取参数.如果有人认为写这个方法是在自找麻烦,请看 二.错误观点 中的第三条.
此方法返回的是一个NameValueCollection对象,判断是否有某个参数时不能使用检查是否存在key值的方法.而是要通key获取值,然后判断值是否为null(和List有些不同):
//获取参数, 假设paramList是一个NameValueCollection对象 p1= paramList["p1"]; //判断是否存在此参数,如果不存在则p1为null if ( !( String.IsNullOrEmpty(p1) ) {...}
另外本方法如果没有传递Encoding或者传递的字符串无法转换成强类型的Encoding对象, 则使用服务器端默认编码格式(即直接使用Request对象的QueryString和Form获取参数).
六.Javascript编码方法发送请求的一方叫做客户端.我们经常需要使用Javascript在客户端编码中文参数.下面javascript中和编码有关的函数:
该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: _ . ! ~ * ( ) 。其他所有的字符都会被转义序列替换。
[已过时] 请使用encodeURI() 或 encodeURIComponent()
该函数的工作原理是这样的:通过找到形式为 %xx 和 %uxxxx 的字符序列(x 表示十六进制的数字),用 Unicode 字符 /u00xx 和 /uxxxx 替换这样的字符序列进行解码。
[已过时] 请使用decodeURI() 或 decodeURIComponent()
该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: _ . ! ~ * ( ) 。
该方法的目的是对 URI 进行完整的编码,因此对以下在 URI 中具有特殊含义的 ASCII 标点符号,encodeURI() 函数是不会进行转义的:;/?:@ =+$,#
[提示] 如果 URI 的参数中含有不能转移的字符,则应当使用 encodeURIComponent() 方法分别对各参数进行编码。
该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: _ . ! ~ * ( ) 。
其他字符(比如 :;/?:@ =+$,# 这些用于分隔 URI 组件的标点符号),都是由一个或多个十六进制的转义序列替换的。
[提示] 此方法会编码URI中的特殊字符
escape和unescape 在V3版本的标准中已经不在推荐使用.应该用encodeURI和encodeURIComponent方法.对于一个URI(URL也是一中URI), 如果我们希望将它作为完整的网址发送请求, 但是上面带有中文, 则应该使用encodeURI方法.如果是要编码参数,则应该使用encodeURIComponent.
下面举例说明这两个方法的区别:
document.write(encodeURIComponent( http://www.w3school.com.cn )+ br / )
document.write(encodeURI( http://www.w3school.com.cn )+ br / )
结果
http%3A%2F%2Fwww.w3school.com.cn
http://www.w3school.com.cn
对于Get方式发送的请求, 不同的浏览器使用不同的编码方式自动为中文参数编码.
比如:Firefox/3.0.5 使用UTF-8, IE6使用GB2312.
Post请求对于Post方式发送的请求, 表单中的参数值对是通过request body发送给服务器,此时浏览器会根据网页的ContentType( text/html; charset=GBK )中指定的编码进行对表单中的数据进行编码,然后发给服务器。在HTML代码的Head中添加:
meta http-equiv= Content-Type content= text/html;charset=gb2312 /
Firefox/3.0.5 会使用根据charset中设置的编码格式编码post的中文参数.
IE6不起作用.
实验表明使用客户端浏览器默认编码格式具有不确定性.所以传递中文时我们要手工编码参数.
写这篇文章的目的是提醒Web程序员要注意浏览器的自动编码, 在一个项目中按照本文提供的解决方案将避免中文参数传递带来的乱码问题.在看了YJingLee s Blog的 CnBlogs博文排版技巧 后我对本文重新进行了整理.
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/13299.html
cjavaxml相关文章
- 用html做简单的日记,学习HTML日记[通俗易懂]
- html超链接位置怎么改,如何修改HTML超链接样式?
- html里面超链接alt_怎样用HTML代码在图片插入超链接[通俗易懂]
- html怎么将表格居中_HTML居中代码
- Extjs4.2 window加载HTML,父子页面html传参
- 【黑马程序员pinik名师讲html】HTML很容易忘记?有它我不慌的
- 【Android RTMP】x264 编码器初始化及设置 ( 获取 x264 编码参数 | 编码规格 | 码率 | 帧率 | B帧个数 | 关键帧间隔 | 关键帧解码数据 SPS PPS )
- 实现HTML编码和解码的JavaScript工具类详解编程语言
- Python编码规范的重要性
- 让Linux灵活运行HTML:简单有效的方法(linux运行html)
- 文件Linux查看HTML文件的简单方法(linux查看html)
- 标签使用MySQL过滤HTML标签(mysql过滤html)
- Linux系统编码修改简单易懂教程(linux系统编码修改)
- 文件MySQL 使用之禅 利用HTML文件实现完美保存(mysql保存html)
- MySQL 快速查询编码技巧(mysql查询编码)
- MySQL 解决中文编码问题(mysql中文编码)
- Linux环境实现HTML文件编辑(linux编辑html)
- Linux 下实现CRC16 编码的简易方法(crc16linux)
- MySQL中使用UTF8编码存储和查询数据的重要性及实现方法(mysql中utf8)
- 从HTML链接搭建Oracle数据库(html链接oracle)
- 碰撞在Redis中寻找编码的旅程(redis获取编码)
- utf-8编码转换成gb2312
- utf8和unicode编码究竟是什么关系?有何区别?
- HTML与javascript常碰到的编码问题
- Linux下修改MySQL编码的方法
- php验证是否是md5编码的简单代码
- JavaScript中最简洁的编码html字符串的方法