文章目录
一、URLENCODE
(1)为什么使用
1、是因为当字符串数据以url的形式传递给web服务器时,字符串中是不允许出现空格和特殊字符的。
2、因为 url 对字符有限制,比如把一个邮箱放入 url,就需要使用 urlencode
函数,因为 url 中不能包含 @
字符。
3、url转义其实也只是为了符合url的规范而已。因为在标准的url规范中中文和很多的字符是不允许出现在url中的。
(2)转换规则
urlencode:
返回字符串,此字符串中除了-_.之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)
按照每个字符对应的字符编码,不是符合我们范围的,统统的转化为%的形式也就是了。自然也是16进制的形式。
那哪些字符是需要转化的呢
ASCII 的控制字符
这些字符都是不可打印的,自然需要进行转化。
什么是可打印字符?
在ASCII码中规定,0-31、128这33个字符属于控制字符,32-127这95个字符属于可打印字符,也就是说网络传输只能传输这95个字符,不在这个范围内的字符无法传输。那么该怎么才能传输其他字符呢?其中一种方式就是使用Base64。
一些非ASCII字符
这些字符自然是非法的字符范围。转化也是理所当然的了。
一些保留字符
很明显最常见的就是“&”了,这个如果出现在url中了,那你认为是url中的一个字符呢,还是特殊的参数分割用的呢?
就是一些不安全的字符了。
例如:空格。为了防止引起歧义,需要被转化为“+”。
和编码无关
通过urlencode的转化规则和目的,我们也很容易的看出,urleocode是基于字符编码的。同样的一个汉字,不同的编码类型,肯定对应不同的urleocode的串。gbk编码的有gbk的encode结果。
apache等服务器,接受到字符串后,可以进行decode,但是还是无法解决编码的问题。编码问题,还是需要靠约定或者字符编码的判断解决。
因此,urleocode只是为了url中一些非ascii字符,可以正确无误的被传输,至于使用哪种编码,就不是eocode所关心和解决的问题了。
(3)java 实现
/**
* @author htl
* @date 2024/12/25
*/
public class UrlEncode {
public static void main(String[] args) throws UnsupportedEncodingException {
String encode = URLEncoder.encode("http://itnanls.cn/中文 ,。?", "UTF-8");
System.out.println(encode);
String decode = URLDecoder.decode(encode, "UTF-8");
System.out.println(decode);
}
}
二、Base64编解码
1、Base64是什么
- Base64是一种用64个字符来表示任意二进制数据的方法。
- 它是一种编码方式,而非加密方式。
- 它通过将二进制数据转变为64个“可打印字符”,完成了数据在HTTP协议上的传输。
2、使用场景
Base64一般用于在HTTP协议下传输二进制数据,由于HTTP协议是文本协议,所以在HTTP协议下传输二进制数据需要将二进制数据转换为字符数据。然而直接转换是不行的。因为网络传输只能传输可打印字符。
什么是可打印字符?
在ASCII码中规定,0-31、128这33个字符属于控制字符,32-127这95个字符属于可打印字符,也就是说网络传输只能传输这95个字符,不在这个范围内的字符无法传输。那么该怎么才能传输其他字符呢?其中一种方式就是使用Base64。
既然可打印的只有95,而比95小的整数最大的2的次方的数字就是64了。
3、加密规则
关于这个编码的规则:
-
首先将待编码的内容转换成8位二进制,每3个字符为一组;
-
如果编码前的长度是3n+1,编码后的内容最后面补上2个 ‘=’,如果编码前的长度是3n+2,编码后 的内容最后面补上1个 ‘=’。
-
再将每一组的二进制内容拆分成6位的二进制,不足6位的后面补足0;
-
每个6进制的数字前面补足0,保证变成8位二进制;
-
将补足后的内容根据base64编码表转换成base64内容输出;
(不足四个字符的时候会用 ‘=’ 来补足,下面会说明)
例子
编码前 “hb”
**1.**根据ascii码转换成8位二进制,3个为一组:
01101000,01100010
**2.**编码前长度是3n+2,所以后面补1个 ‘=’:
01101000,01100010,=
**3.**拆分成6位二进制,不足6位的在后面补足0,0010补足变成001000:
011010,000110,001000,=
**4.**每个6进制的数字前面补足0:
0011010,00000110,00000010,=
**5.**根据base64编码表输出:
aGI=
Table 1: The Base64 Alphabet
索引 | 对应字符 | 索引 | 对应字符 | 索引 | 对应字符 | 索引 | 对应字符 |
---|---|---|---|---|---|---|---|
0 | A | 17 | R | 34 | i | 51 | z |
1 | B | 18 | S | 35 | j | 52 | 0 |
2 | C | 19 | T | 36 | k | 53 | 1 |
3 | D | 20 | U | 37 | l | 54 | 2 |
4 | E | 21 | V | 38 | m | 55 | 3 |
5 | F | 22 | W | 39 | n | 56 | 4 |
6 | G | 23 | X | 40 | o | 57 | 5 |
7 | H | 24 | Y | 41 | p | 58 | 6 |
8 | I | 25 | Z | 42 | q | 59 | 7 |
9 | J | 26 | a | 43 | r | 60 | 8 |
10 | K | 27 | b | 44 | s | 61 | 9 |
11 | L | 28 | c | 45 | t | 62 | + |
12 | M | 29 | d | 46 | u | 63 | / |
13 | N | 30 | e | 47 | v | ||
14 | O | 31 | f | 48 | w | ||
15 | P | 32 | g | 49 | x | ||
16 | Q | 33 | h | 50 | y |
4、总结
- 可以将
任意的二进制
数据进行Base64编码。 - 数据加密之后,数据量会
变大
,变大1/3
左右。 - 编码后有个非常显著的特点,末尾有个=号。
- 可进行
反向解密
。 - Base64编码具有不可读性
5、Base64程序
/**
* @author htl
* @date 2024/12/25
*/
public class Base64Test {
public static void main(String[] args) {
// 获取编码器
Base64.Encoder encoder = Base64.getEncoder();
byte[] encode = encoder.encode("abc".getBytes());
System.out.println(new String(encode));
// 获取解码器
Base64.Decoder decoder = Base64.getDecoder();
byte[] decode = decoder.decode(encode);
System.out.println(new String(decode));
}
}
三、hash摘要算法
1、MD5
MD5信息摘要算法(英语:MD5 Message-Digest Algorithm),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hash value),用于确保信息传输完整一致。MD5由美国密码学家罗纳德·李维斯特(Ronald Linn Rivest)设计,于1992年公开,用以取代MD4算法。这套算法的程序在 RFC 1321 标准中被加以规范。1996年后该算法被证实存在弱点,可以被加以破解,对于需要高度安全性的数据,专家一般建议改用其他算法,如SHA-2。2004年,证实MD5算法无法防止碰撞(collision),因此不适用于安全性认证,如SSL公开密钥认证或是数字签名等用途。
/**
* @author htl
* @date 2024/12/25
*/
public static void main(String[] args) throws Exception {
MessageDigest md5 = MessageDigest.getInstance("MD5");
byte[] digest = md5.digest("123".getBytes(