簡介
base64編碼可以將任意二進制數(shù)據(jù)編碼為只包含由定義的64個ascⅡ字符構(gòu)成的字符串,方便通過某些不支持二進制數(shù)據(jù)的協(xié)議傳遞二進制文件。
編碼方式
因為base64編碼的編碼表只有64個字符,每一個字符只能對應6位二進制數(shù)($2^6=64$)串述,因此需要把6bit的原始數(shù)據(jù)編碼成一個字符(8bit),但這樣會留下2bit無法編碼,所以我們需要把3byte(46bit)的原始數(shù)據(jù)作為一個編碼單元編碼為4byte(48bit)的字符串脯倚。當然這樣仍然可能余下1byte或者2byte數(shù)據(jù)不夠一個編碼單元,我們需要根據(jù)以下規(guī)則編碼最后一個不足3byte的單元:
-
若余下1byte(8bit)數(shù)據(jù),將其填充0到3byte(24bit)推正,按照正常方式編碼這3byte(24bit)中的前12bit得到2個base64字符恍涂,余下12bit編碼為2個等號("=")
例如
原始數(shù)據(jù)最后余下10101010(8bit) 將其填充為10101010 00000000 00000000(24bit) 取前6位101010,編碼為字符q 取接下來6位100000植榕,編碼為字符g 之后12個0編碼為兩個等號"==" 即10101010(8bit)編碼結(jié)果為qg==(4byte)
?
若余下2byte(16bit)數(shù)據(jù)再沧,將其填充0到3byte(24bit),按照正常方式編碼這3byte(24bit)中的前18bit得到3個base64字符尊残,余下6bit編碼為1個等號("=")
原始數(shù)據(jù)最后余下10101010 10101010(16bit)
將其填充為10101010 10101010 00000000(24bit)
取前6位101010炒瘸,編碼為字符q
取接下來6位101010,編碼為字符q
再取接下來6位101000寝衫,編碼為字符o(小寫字母o)
之后6個0編碼為一個等號"="
即10101010 10101010(16bit)編碼結(jié)果為qqo=(4byte)
解碼就是編碼的逆變換什燕,在處理最后一個單元時可以先把“=”碼值視為0正常解碼的到3byte數(shù)據(jù),然后再根據(jù)“=”的個數(shù)決定最后一個單元解碼結(jié)果的有效長度竞端。
編程實現(xiàn)
base64編碼算法的核心是移位操作屎即,通過移位操作提取出原始數(shù)據(jù)中的高6bit,低6bit事富,高4bit技俐,低4bit,高2bit统台,低2bit然后拼接起來得到6bit雕擂,以一個編碼單位為例,以下為編碼的核心部分:
編碼:
char base64_encode_table[64]="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
unsigned char origin_data[3];
unsigned char encode_data[4];
unsigned char tmp1,tmp2;
/*取前6bit,原始數(shù)據(jù)第一個byte右移2位得到碼值贱勃,根據(jù)base64編碼表得到字符*/
encode_data[0] = base64_encode_table[orgin_data[0]>>2]
/*取接下來6bit井赌,包括第一個byte的低2bit和第二個byte的高4bit*/
tmp1 = orgin_data[0]<<6;
tmp1 = tmp1>>2; //6bit拼起來放到一個字節(jié)的低6bit
tmp2 = origin_data[1]>>4;
encode_data[1] = base64_encode_table[tmp1+tmp2];
/*取接下來6bit,包括第二個byte的低4bit和第三個byte的高2bit*/
tmp1 = orgin_data[1]<<4;
tmp1 = tmp1>>2 //6bit拼起來放到一個字節(jié)的低6bit
tmp2 = origin_data[2]>>6;
encode_data[2] = base64_encode_table[tmp1+tmp2];
/*取最后6bit*/
tmp1 = origin_data[2]<<2;
tmp1 = tmp1>>2;
encode_data[3] = base64_encode_table[tmp1];
解碼:
首先查base64編碼表把編碼字符恢復成碼值
unsigned char encode_data[4];
unsigned char origin_data[3];
unsigned char tmp1,tmp2;
/*恢復第一個byte贵扰,包括encode_data第一個byte的低6bit和第二個byte的第3仇穗,4個bit*/
tmp1 = encode_data[0]<<2;
tmp2 = encode_data[1]>>4;
tmp2 = tmp2 <<6;
orgin_data[0] = tmp1+tpm2;
/*恢復第二個byte,包括encode_data第二個byte的低4bit和第三個byte的第3戚绕,4纹坐,5,6個bit*/
tmp1 = encode_data[1]<<4;
tmp2 = encode_data[2]>>2;
orgin_data[1] = tmp1+tpm2;
/*恢復第二個byte舞丛,包括encode_data第三個byte的低2bit和第四個byte的低6bit*/
tmp1 = encode_data[2]<<6;
tmp2 = encode_data[3];
orgin_data[2] = tmp1+tpm2;
完整的源代碼在https://github.com/Janaury/c-encode.git耘子,查看c-encode.h中的說明和c-encode.c中的源代碼,此外還有一些其他編碼哦