网页URL的合法字符分成两类
URL元字符:分号(;),逗号(’,’),斜杠(/),问号(?),冒号(:),at(@),&,等号(=),加号(+),美元符号($),井号(#)
语义字符:a-z,A-Z,0-9,连词号(-),下划线(_),点(.),感叹号(!),波浪线(~),星号(*),单引号(),圆括号(()`)
除了以上字符,其他字符出现在URL之中都必须转义,规则是根据操作系统的默认编码,将每个字节转为百分号(%)加上两个大写的十六进制字母。在浏览器地址栏里,浏览器认为%
是个转义字符,浏览器会把%与%
之间的编码,两位两位取出后进行解码,然后再传递给后端,然后由后端进行再次解码。
一般平台字符集编码方式相同可以使用如下方法编码传输
encodeURI、decodeURI、encodeURIComponent、decodeURIComponent
encodeURI
方法的参数是一个字符串,代表整个URL
。它会将元字符和语义字符之外的字符,都进行转义。
decodeURI
用于还原转义后的URL。它是encodeURI
方法的逆运算。
encodeURIComponent
只转除了语义字符之外的字符,元字符也会被转义。因此,它的参数通常是URL
的路径或参数值,而不是整个URL
。
decodeURIComponent
用于还原转义后的URL
片段。它是encodeURIComponent
方法的逆运算。
如果平台编码方式不同可以使用 xxx=encodeURIComponent(base64Encode(encodeURIComponent('中文字符内容'))) 方式进行传输,(此处base64xxx为自己实现的base64转码算法)
即在先将中文字符转义后,进行base64操作,然后再次转义进行传输,接收方使用decodeURIComponent(base64Decode(decodeURIComponent(xxx))) 方式解码,顺利解决不同平台导致的乱码现象。