- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

一文搞懂Base64编码原理

码农爱学习发表于 2021/07/25 13:43:34 2021/07/25

【摘要】 Base64是最常见的用于传输8Bit字节码的编码方式之一，它是一种基于64个可打印字符来表示二进制数据的方法。

Base64是最常见的用于传输8Bit字节码的编码方式之一，它是一种基于64个可打印字符来表示二进制数据的方法。

Base64是什么

Base64编码，是由64个字符组成编码集：26个大写字母A~Z，26个小写字母a~z，10个数字0~9，符号“+”与符号“/”。Base64编码的基本思路是将原始数据的三个字节拆分转化为四个字节，然后根据Base64的对应表，得到对应的编码数据。

当原始数据凑不够三个字节时，编码结果中会使用额外的符号“=”来表示这种情况。

Base64编码表

码值	字符	码值	字符	码值	字符	码值	字符
0	A	16	Q	32	g	48	w
1	B	17	R	33	h	49	x
2	C	18	S	34	i	50	y
3	D	19	T	35	j	51	z
4	E	20	U	36	k	52	0
5	F	21	V	37	l	53	1
6	G	22	W	38	m	54	2
7	H	23	X	39	n	55	3
8	I	24	Y	40	o	56	4
9	J	25	Z	41	p	57	5
10	K	26	a	42	q	58	6
11	L	27	b	43	r	59	7
12	M	28	c	44	s	60	8
13	N	29	d	45	t	61	9
14	O	30	e	46	u	62	+
15	P	31	f	47	v	63	/

Base64编码步骤

将原始数据按照每三个字节作为一组进行划分，每组一共是24个二进制位。
再将这24个二进制位，每6个一划分，分为四组（6×4=24个二进制位）。
然后在每组前面补上00，扩展成8×4=32个二进制位，即四个字节（因为每个字节前面有2个0，所以每个字节的最大值是63）。
最后根据Base64编码表，将这四个字节的码值，转换为对应的Base64的字符即可。

Base64编码过程举例

情况1：正常的3个字节编码

将单词“PCB”转换为Base64编码：

"P"、"C"、"B"的ASCII值分别是80、67、66，对应的二进制值是0101 0000、0100 0011、0100 0010，将它们连成一个24位的二进制字符串010100000100001101000010。
将这个24位的二进制字符串，每6个一组分成4组：010100、000100、001101、000010。
在每组前面加两个00，扩展成32个二进制位，即四个字节：00010100、00000100、00001101、00000010。它们的十进制值分别是19、22、5、46。(最前面加上两个0只是为了凑成一个字节，实际上其本身的数值是没有变化的)
根据上表，得到每个值对应Base64编码，即U、E、N、C。

情况2：剩余2个字节编码

对于2个字节（16个二进制数）的情况，比如将“PC”转换为Base64编码：

转换方法同上，区别在于：

16个二进制数，每6个一组分割，最后剩余4个，这时再在后面补两个0凑成6个。
然后还按照基础的方法转换，最后补一个“=”即可

转换过程如下表，最终将“PC”转换为了“UEM=”

情况3：剩余1个字节编码

对于12个字节（8个二进制数）的情况，比如将“P”转换为Base64编码：

转换方法同上，区别在于：

16个二进制数，每6个一组分割，最后剩余2个，后面要再补4个0
然后还按照基础的方法转换，最后补两个“=”即可

转换过程如下表，最终将“P”转换为了“UA==”

Base64编解码C程序

编码程序

编码的程序设计思路，就是按照上面讲解的编码过程，每3个原始字符为一组，进行编码，得到4个base64的字符。对于不够3个字符的情况，编码的base64的字符后面补上一到两个=号。

#include <stdio.h>
#include <string.h>

/*base64符号表*/
const char *base64Arr = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
/*base64增补符号*/ 
const char paddingChar = '=';

/** @func:  base64_encode
*   @brief: base64编码 
*   @para:  [srcData]:要进行编码的原始数据
*           [resBase64]:base64编码结果 
*   @return:none
*/
void base64_encode(const unsigned char * srcData, char * resBase64)
{
    int i=0; /*原始数据索引*/ 
    int j=0; /*base64结果索引*/ 
    unsigned char transIdx=0;    // 索引是8位，但是高两位都为0
    const int srcLen = strlen((const char*)srcData);
    
    /*每3个一组，进行编码*/
    for(i=0; i < srcLen; i+=3) 
    {
        /*取出第1个字符的高6位*/ 
        transIdx = ((srcData[i] >> 2) & 0x3f); /*0011 1111*/
        /*查表*/ 
        resBase64[j++] = base64Arr[(int)transIdx];
        
        /*取出第1个字符的低2位*/ 
        transIdx = ((srcData[i] << 4) & 0x30); /*0011 0000*/
        
        /*第1个字符后面还有字符*/ 
        if (i + 1 < srcLen) 
        {
            /*取出第2个字符的高4位，并与第1个字符的低2位进行组合*/ 
            transIdx |= ((srcData[i + 1] >> 4) & 0x0f); /*0000 1111*/
            /*查表*/ 
            resBase64[j++] = base64Arr[(int)transIdx];
        }
        else /*第1个字符后面没有字符了*/
        {
            /*直接使用第1个字符的低2位查表*/
            resBase64[j++] = base64Arr[(int)transIdx];
            
            /*然后补上两个=号*/ 
            resBase64[j++] = paddingChar;
            resBase64[j++] = paddingChar;
            break;   /*没有数据了，break结束*/ 
        }
        
        /*取出第2个字符的低4位*/ 
        transIdx = ((srcData[i + 1] << 2) & 0x3c); /*0011 1100*/
        
        /*第2个字符后面还有字符*/ 
        if (i + 2 < srcLen)
        { 
            /*取出第3个字符的高2位，并与第2个字符的低4位进行组合*/ 
            transIdx |= ((srcData[i + 2] >> 6) & 0x03);  /*0000 0011*/
            /*查表*/ 
            resBase64[j++] = base64Arr[(int)transIdx];
            
            /*取出第3个字符的低6位*/ 
            transIdx = srcData[i + 2] & 0x3f; /*0011 1111*/ 
            /*查表*/ 
            resBase64[j++] = base64Arr[(int)transIdx];
        }
        else /*第2个字符后面没有字符了*/
        {
            /*直接使用第2个字符的低4位查表*/
            resBase64[j++] = base64Arr[(int)transIdx];
            
            /*然后补上一个=号*/ 
            resBase64[j++] = paddingChar;
            break;  /*没有数据了，break结束*/ 
        }
    }
    
    /*结束符*/ 
    resBase64[j] = '\0'; 
}

解码程序

解码的程序设计思路，其实就是编码的反过程，把要解码的base64符号，每4个为一组，译码成3个字符。对于最后出现的=的情况，就说明是要结束了，直接使用剩余的base64符号进行译码，然后就结束了。

/** @func:  idx_in_base64Arr
*   @brief: 在base64符号表中查找字符c对应的索引值
*   @para:  [c]:要查找的字符
*   @return:字符c在base64符号表中对应的索引值(0~63) 
*/
int idx_in_base64Arr(char c) 
{
    /*在base64表中搜索第一次出现字符c的位置*/
    const char *pIdx = strchr(base64Arr, c);
    if (NULL == pIdx)
    {
        /*找不到对应的base64字符，说明输入的base64字符串有误*/ 
        return -1;
    }
    
    /*返回字符c在base64表中的位置*/
    return (pIdx - base64Arr);
}   

/** @func:  base64_decode
*   @brief: base64解码 
*   @para:  [srcBase64]:要进行解码的原始base64数据
*           [resData]:解码出的结果 
*   @return:none
*/
void base64_decode(const char *srcBase64, unsigned char *resData)
{
    int i = 0; /*原始base64数据索引*/ 
    int j = 0; /*解码后的结果数据索引*/ 
    int trans[4] = {0,0,0,0}; /*4个base64符号对应的表中的位置（0~63的数字）转换值*/ 
    
    /*base64符号每4个一组，译码成3个字符*/
    for (i=0; srcBase64[i]!='\0'; i+=4)
    {
        /*------译码第1个字符------*/
        /*前2个base64符号在表中的位置（0~63的数字）*/
        trans[0] = idx_in_base64Arr(srcBase64[i]);
        trans[1] = idx_in_base64Arr(srcBase64[i+1]);
        
        /*第1个符号的后6位，与第2个符号的6、5位，译出第1个字符*/ 
        resData[j++] = ((trans[0] << 2) & 0xfc) | ((trans[1]>>4) & 0x03); /*1111 1100   0000 0011 */ 

        /*------译码第2个字符------*/  
        /*第3个base64符号是否是=号*/
        if (srcBase64[i+2] != '=')
        {
            /*第3个base64符号在表中的位置（0~63的数字）*/
            trans[2] = idx_in_base64Arr(srcBase64[i + 2]);
        }
        else
        {
            break;/*没有数据了，break结束*/ 
        }
        /*第2个符号的后4位，与第3个符号的6、5、4、3位，译出第2个字符*/ 
        resData[j++] = ((trans[1] << 4) & 0xf0) | ((trans[2] >> 2) & 0x0f); /*1111 0000  0000 1111*/
  
        /*------译码第3个字符------*/
        /*第4个base64符号是否是=号*/
        if (srcBase64[i + 3] != '=')
        {
            /*第4个base64符号在表中的位置（0~63的数字）*/
            trans[3] = idx_in_base64Arr(srcBase64[i + 3]);
        }
        else
        {
            break;/*没有数据了，break结束*/ 
        }
        /*第3个符号的后2位，与第4个符号的后6位，译出第3个字符*/ 
        resData[j++] = ((trans[2] << 6) & 0xc0) | (trans[3] & 0x3f); /*1100 0000   0011 1111*/ 
    }
  
    /*结束符*/ 
    resData[j] = '\0';
}

测试程序

使用字符串“PCB”进行base64编码测试，然后再将编码得到的结果，进行解码测试。

/*测试*/
int main()
{
    /*定义要进行base64编码的字符串*/ 
    const unsigned char *srcData = "PCB" ;
    
    /*先测试编码*/
    char base64[128];
    base64_encode(srcData, base64);  
    printf("base64编码：%s\n",base64);

    /*再测试解码*/ 
    char resData[128];
    base64_decode(base64, (unsigned char*)resData);
    printf("base64解码：%s", resData);

    return 0;
}

输出结果如下，可以看出，“PCB”进行base64编码，得到了“UENC”，然后再反向解码，又得到了“PCB”

base64编码：UENC
base64解码：PCB
--------------------------------
Process exited after 0.01123 seconds with return value 0
请按任意键继续. . .

完整程序可从我的gitee仓库下载：https://gitee.com/xxpcb/c-test/tree/master/C-Base64-Test

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

一文搞懂Base64编码原理

Base64是什么

Base64编码表

Base64编码步骤

Base64编码过程举例

情况1：正常的3个字节编码

情况2：剩余2个字节编码

情况3：剩余1个字节编码

Base64编解码C程序

编码程序

解码程序

测试程序

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

码值	字符	码值	字符	码值	字符	码值	字符
0	A	16	Q	32	g	48	w
1	B	17	R	33	h	49	x
2	C	18	S	34	i	50	y
3	D	19	T	35	j	51	z
4	E	20	U	36	k	52	0
5	F	21	V	37	l	53	1
6	G	22	W	38	m	54	2
7	H	23	X	39	n	55	3
8	I	24	Y	40	o	56	4
9	J	25	Z	41	p	57	5
10	K	26	a	42	q	58	6
11	L	27	b	43	r	59	7
12	M	28	c	44	s	60	8
13	N	29	d	45	t	61	9
14	O	30	e	46	u	62	+
15	P	31	f	47	v	63	/

码值	字符	码值	字符	码值	字符	码值	字符
0	A	16	Q	32	g	48	w
1	B	17	R	33	h	49	x
2	C	18	S	34	i	50	y
3	D	19	T	35	j	51	z
4	E	20	U	36	k	52	0
5	F	21	V	37	l	53	1
6	G	22	W	38	m	54	2
7	H	23	X	39	n	55	3
8	I	24	Y	40	o	56	4
9	J	25	Z	41	p	57	5
10	K	26	a	42	q	58	6
11	L	27	b	43	r	59	7
12	M	28	c	44	s	60	8
13	N	29	d	45	t	61	9
14	O	30	e	46	u	62	+
15	P	31	f	47	v	63	/

一文搞懂Base64编码原理

Base64是什么

Base64编码表

Base64编码步骤

Base64编码过程举例

情况1：正常的3个字节编码

情况2：剩余2个字节编码

情况3：剩余1个字节编码

Base64编解码C程序

编码程序

解码程序

测试程序

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

码值	字符	码值	字符	码值	字符	码值	字符
0	A	16	Q	32	g	48	w
1	B	17	R	33	h	49	x
2	C	18	S	34	i	50	y
3	D	19	T	35	j	51	z
4	E	20	U	36	k	52	0
5	F	21	V	37	l	53	1
6	G	22	W	38	m	54	2
7	H	23	X	39	n	55	3
8	I	24	Y	40	o	56	4
9	J	25	Z	41	p	57	5
10	K	26	a	42	q	58	6
11	L	27	b	43	r	59	7
12	M	28	c	44	s	60	8
13	N	29	d	45	t	61	9
14	O	30	e	46	u	62	+
15	P	31	f	47	v	63	/