为什么会有Base64编码呢?因为有些网络传送渠道并不支持所有的字节,例如传统的邮件只支持可见字符的传送,像ASCII码的控制字符就不能通过邮件传送。这样用途就受到了很大的限制,比如图片二进制流的每个字节不可能全部是可见字符,所以就传送不了。最好的方法就是在不改变传统协议的情况下,做一种扩展方案来支持二进制文件的传送。把不可打印的字符也能用可打印字符来表示,问题就解决了。Base64编码应运而生,Base64就是一种基于64个可打印字符来表示二进制数据的表示方法。
什么是 Base64
Base64 是一种基于 64 个可打印字符来表示二进制数据的表示方法。由于 2⁶ = 64 ,所以每 6 个比特为一个单元,对应某个可打印字符。3 个字节有 24 个比特,对应于 4 个 base64 单元,即 3 个字节可由 4 个可打印字符来表示。相应的转换过程如下图所示:
Base64 的使用场景
Base64 常用于在处理文本数据的场合,表示、传输、存储一些二进制数据,包括 MIME 的电子邮件及 XML 的一些复杂数据。在 MIME 格式的电子邮件中,base64 可以用来将二进制的字节序列数据编码成 ASCII 字符序列构成的文本。使用时,在传输编码方式中指定 base64。使用的字符包括大小写拉丁字母各 26 个、数字 10 个、加号 + 和斜杠 /,共 64 个字符,等号 = 用来作为后缀用途。Base64 相应的索引表如下:
看一下Base64的索引表,字符选用了"A-Z、a-z、0-9、+、/" 64个可打印字符。数值代表字符的索引,这个是标准Base64协议规定的,不能更改。64个字符用6个bit位就可以全部表示,一个字节有8个bit位,剩下两个bit就浪费掉了,这样就不得不牺牲一部分空间了。这里需要弄明白的就是一个Base64字符是8个bit,但是有效部分只有右边的6个bit,左边两个永远是0。
那么怎么用6个有效bit来表示传统字符的8个bit呢?8和6的最小公倍数是24,也就是说3个传统字节可以由4个Base64字符来表示,保证有效位数是一样的,这样就多了1/3的字节数来弥补Base64只有6个有效bit的不足。
Base64 编码过程
-
按照从左往右的规则,每三个字节作为一组,一共就是24个二进制位。
-
将这24个二进制位分为四组,每组6个二进制位。
-
之后在每组数据前面添加00,组成每个组8个二进制位,此时变成了32个二进制位,即四个字节
-
四个字节在Base64 索引表查找得到的对应符号,base64编码完成
解码原理是将4个字节转换成3个字节,先读入4个6位(用或运算),每次左移6位,再右移3次,每次8位,这样就还原了。
了解了 Base64 编码原理,我们以编码 Man
字符串为例,来直观的感受一下编码过程。Man
由 M、a 和 n 3 个字符组成,它们对应的 ASCII 码为 77、97 和 110。
接着我们以每 6 个比特为一个单元,进行 base64 编码操作,具体如下图所示:
由图可知,Man
(3字节)编码的结果为 TWFu
(4字节),很明显经过 base64 编码后体积会增加 1/3。Man
这个字符串的长度刚好是 3,我们可以用 4 个 base64 单元来表示。但如果待编码的字符串长度不是 3 的整数倍时,应该如何处理呢?
如果要编码的字节数不能被 3 整除,最后会多出 1 个或 2 个字节,那么可以使用下面的方法进行处理:先使用 0 字节值在末尾补足,使其能够被 3 整除,然后再进行 base64 的编码
以编码字符 A 为例,其所占的字节数为 1,不能被 3 整除,需要补 2 个字节,具体如下图所示:
由上图可知,字符 A 经过 base64 编码后的结果是 QQ==
,该结果后面的两个 =
代表补足的字节数。而最后个 1 个 base64 字节块有 4 位是 0 值。
接着我们来看另一个示例,假设需编码的字符串为 BC
,其所占字节数为 2,不能被 3 整除,需要补 1 个字节,具体如下图所示:
由上图可知,字符串 BC 经过 base64 编码后的结果是 QkM=
,该结果后面的 1 个 =
代表补足的字节数。而最后个 1 个 base64 字节块有 2 位是 0 值。
对字符串进行 Base64 编解码
Encoder方式
@Test
public void testEncoder() {
String str = “thinkwon”;
// 使用基本编码
String base64encodedString = Base64.getEncoder().encodeToString(str.getBytes(StandardCharsets.UTF_8));
System.out.println(“Base64 编码字符串 (基本) :” + base64encodedString);
// 解码
byte[] base64decodedBytes = Base64.getDecoder().decode(base64encodedString);
System.out.println("原始字符串: " + new String(base64decodedBytes, StandardCharsets.UTF_8));
}
输出结果
Base64 编码字符串 (基本) :dGhpbmt3b24=
原始字符串: thinkwon
UrlEncoder方式
@Test
public void testUrlEncoder() {
String str = “thinkwon”;
// 使用基本编码
String base64encodedString = Base64.getUrlEncoder().encodeToString(str.getBytes(StandardCharsets.UTF_8));
System.out.println(“Base64 编码字符串 (URL) :” + base64encodedString);
// 解码
byte[] base64decodedBytes = Base64.getUrlDecoder().decode(base64encodedString);
System.out.println("原始字符串: " + new String(base64decodedBytes, StandardCharsets.UTF_8));
}
输出结果
Base64 编码字符串 (URL) :dGhpbmt3b24=
原始字符串: thinkwon
MimeEncoder方式
@Test
public void testMimeEncoder() {
StringBuilder stringBuilder = new StringBuilder();
for (int i = 0; i < 2; ++i) {
stringBuilder.append(UUID.randomUUID().toString());
}
System.out.println("原始字符串: " + stringBuilder.toString());
byte[] mimeBytes = stringBuilder.toString().getBytes(StandardCharsets.UTF_8);
String mimeEncodedString = Base64.getMimeEncoder().encodeToString(mimeBytes);
System.out.println(“Base64 编码字符串 (MIME) :”);
System.out.println(mimeEncodedString);
byte[] decode = Base64.getMimeDecoder().decode(mimeEncodedString);
System.out.println("解码字符串: " + new String(decode, StandardCharsets.UTF_8));
}
输出结果
原始字符串: fb51e7aa-2303-4ffc-be8c-44de37b1417e783f2921-1a68-462e-a5e1-32d1ad6cc51a
Base64 编码字符串 (MIME) :
ZmI1MWU3YWEtMjMwMy00ZmZjLWJlOGMtNDRkZTM3YjE0MTdlNzgzZjI5MjEtMWE2OC00NjJlLWE1
ZTEtMzJkMWFkNmNjNTFh
解码字符串: fb51e7aa-2303-4ffc-be8c-44de37b1417e783f2921-1a68-462e-a5e1-32d1ad6cc51a
对文件进行 Base64 编解码
文件与 Base64 字符串转换工具类
/**
-
文件转化成base64字符串
-
@param path 文件路径
-
@return String base64字符串
*/
public static String fileToBase64Str(String path) {
InputStream in = null;
byte[] data = null;
try {
in = new FileInputStream(new File(path));
data = new byte[in.available()];
in.read(data);
} catch (Exception e) {
e.printStackTrace();
} finally {
if (in != null) {
try {
in.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
// 对字节数组Base64编码
return Base64.getMimeEncoder().encodeToString(data);
}
/**
最后
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Java工程师,想要提升技能,往往是自己摸索成长,自己不成体系的自学效果低效漫长且无助。
因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,不论你是刚入门Java开发的新手,还是希望在技术上不断提升的资深开发者,这些资料都将为你打开新的学习之门!
如果你觉得这些内容对你有帮助,需要这份全套学习资料的朋友可以戳我获取!!
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
x1UWPm-1715710658549)]
[外链图片转存中…(img-gT8bJskT-1715710658549)]
[外链图片转存中…(img-33ZHz7tA-1715710658550)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,不论你是刚入门Java开发的新手,还是希望在技术上不断提升的资深开发者,这些资料都将为你打开新的学习之门!
如果你觉得这些内容对你有帮助,需要这份全套学习资料的朋友可以戳我获取!!
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!