一文详解 Base64编码原理

简介: Base64 是一种 编码方式,最早出现在电子邮件传输协议中。电子邮件问世之初,传递消息时只支持 ASCII 字符,后来随着电子邮件的广泛使用,传递非ASCII字符内容的需求增加,例如:传输中文、传输文件(图片、视频)。

最近在看Android的签名与验签机制,其中涉及到 MD5、SHA2、SHA256 等摘要算法,也涉及到 Base64 编码机制。这里先从简单的入手,记录一下 Base64 编码机制的原理。

一、Base64由来

Base64 是一种编码方式,最早出现在电子邮件传输协议中。
电子邮件问世之初,传递消息时只支持 ASCII 字符,后来随着电子邮件的广泛使用,传递非ASCII字符内容的需求增加,例如:传输中文、传输文件(图片、视频)。
为解决这一问题,最好的方案是在不改变传输协议的基础上,做一种扩展方案来支持非ASCII内容传输把非 ASCII 字符用ASCII来表示,Base64编码应运而生。

Base64由来

二、Base64定义

Base64 是一种基于64个 ASCII 字符来表示二进制数据的表示方法
Base64 将8比特位为一个单元的字节数据拆分为以6个比特位为一个单元的二进制片段,每6个比特位单元对应Base64索引表中的一个字符,这样最终构成一个超过编码前字节数据33%的字符串。

Base64 中64个可打印字符包括字母A-Za-z、数字0-9,此外还有两个字符为+和/,这样构成了共有64字符的Base64索引表

Base64索引表

三、Base64编码原理

Base64 将8比特位为一个单元的字节数据拆分为以6个比特位为一个单元的二进制片段;每6个比特位单元对应Base64索引表中的一个字符
按照以上方式可以算出base64编码后的字符串大约比编码前增加了33%

举例如下:
编码 Man 的Base64结果为TWFu,Base64编码计算过程如下:

文      本:M        a        n
ASCII 编码:77       97       110
8bit  字节:01001101 01100001 01101110
6bit  字节:010011 010110 000101 101110
Base64索引:19     22     5      46
Base64编码:T      W      F      u

为什么一些Base64后的字符中末尾有“==”

以上举例中:
编码前字节数正好被3整除,转化为二进制ASCII 编码3*8=24 )后,正好可以被6整除
编码前字节数不能被3整除,最后会余出1个或2个字节,那么编码时需要:

  • 使用 000000 字节值在末尾补足,使其字节数能够被3整除;
  • 编码时补位的6个比特位单元= 表示。

举例如下:
编码 Lucy 的Base64结果为THVjeQ==,Base64编码计算过程如下:

文      本:L        u        c        y
ASCII 编码:76       117      99       121
8bit  字节:01001100 01110101 01100011 01111001 (补)00000000 (补)00000000
6bit  字节:010011 000111 010101 100011 011110 010000 000000 000000
Base64索引:19     7      21     35     30     16     (补位)  (补位)
Base64编码:T      H      V      j      e      Q      =      =

由于Lucy只有4个字母,所以按3个一组的话,第二组还有两个空位。所以需要用00000000来补位,这里就需要注意,因为是需要补齐而出现的0,转化成十进制的时候就不能按常规用base64编码表来对应,所以不是A,编码后对应 “=” 。

参考

维基百科 Email:
https://en.wikipedia.org/wiki/Email

Content-Transfer-Encoding:
https://www.jianshu.com/p/7e0c2d078745

Base64 Data Encodings:
https://datatracker.ietf.org/doc/html/rfc4648

= THE END =

文章首发于公众号”CODING技术小馆“,如果文章对您有帮助,可关注我的公众号。

目录
相关文章
|
Oracle 关系型数据库 数据库
Oracle中merge Into的用法
Oracle中merge Into的用法
|
SQL 人工智能 自然语言处理
Copilot的优势
【2月更文挑战第13天】Copilot的优势
580 5
Copilot的优势
|
机器学习/深度学习 API 开发工具
通义千问API入门教程
本教程将带你从零开始,快速了解如何通过 API 使用通义千问大模型,并尝试使用大模型 API 开发一些简单的应用应用到工作中,提升效率。
|
6月前
|
存储 安全 算法
【HarmonyOS 5】鸿蒙应用数据安全详解
【HarmonyOS 5】鸿蒙应用数据安全详解
211 0
|
存储 JavaScript API
Vuex的魔法宝典:掌握State, Getters, Mutations和Actions,让状态管理不再是难题
【8月更文挑战第27天】Vuex是Vue.js应用程序的状态管理工具,通过集中式存储管理组件状态并确保状态按照预定义的规则发生变化。
380 0
|
Java 云计算 微服务
手写@RefreshScope,很简单嘛!
【10月更文挑战第8天】 在微服务架构和云计算时代,动态配置管理变得越来越重要。Spring Cloud提供了@RefreshScope注解,允许我们在不重启应用的情况下,动态刷新配置。但你有没有想过,这个注解是如何实现的呢?本文将带你一起手写一个简化版的@RefreshScope,一探究竟!
301 7
|
存储 关系型数据库 MySQL
XtraBackup 的版本大揭秘:突破迷雾,揭开其支持 MySQL 版本的震撼真相,捍卫数据安全!
【8月更文挑战第7天】XtraBackup 是 MySQL 备份领域的热门工具,适用于多个版本。它为 MySQL 8.0 提供高效备份,确保数据安全。同样支持 MySQL 5.7 和其他稳定版如 5.6,精确备份各类数据结构。
321 0
|
自然语言处理 算法 关系型数据库
postgresql 全文检索 SCWS和zhparser部署
UPDATE report_content SET content_tsv = to_tsvector('testzhcfg',content);
417 8
|
域名解析 安全 网络安全
全面了解CC攻击和防范策略
CC攻击是一种针对Web服务的攻击,模仿正常用户请求耗尽服务器资源。攻击类型包括直接、肉鸡、僵尸和代理攻击。目标包括网站、API、登录页面、基础设施组件、云服务、金融机构等。影响包括服务中断、性能下降、经济损失、品牌受损及法律问题。判断CC攻击可通过观察CPU上升、网站响应慢或检查系统日志。防护措施包括IP封禁、人机验证、使用安全加速服务、静态化页面、更改端口、完善日志和域名解析策略。CC与DDoS攻击主要区别在于攻击原理、对象、危害、门槛和所需流量。综合运用多种防御策略能有效抵御CC攻击。