背景介紹
base64的作用是以可見字符的形式對非純文本文件進行編碼轉(zhuǎn)換, 簡而言之就是用可見字符集中的字符替換原有的二進制文件.
-
base64編碼之所以叫base64是因為這個<可見字符集>是由64個可見字符構(gòu)成.例如:
['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '-', '/']
工作原理
- 對原有二進制數(shù)據(jù)進行分組, 分組方式為第三個Byte為一組, 也就是說一組為24個bit.
- 對每組的24個bit(3Byte)再進行分組,分為4組, 每組6個bit.
- 因為每組是6個bit, 那么6個bit的二進制序列最多表示64種可能性, 正好由我們的<可見字符集>中的字符表示每種序列.
- 如果原有二進制數(shù)據(jù)不是3Byte的整數(shù)倍, 那么剩下的1個或2個byte 我們使用
\x00
進行補充,然后再蠔編碼, 我們會發(fā)現(xiàn)行尾加上一個或兩個=
號,代表表示補充了多少字節(jié)\x00
base64分組示意圖
代碼示例
- 編碼
import base64
#如果有中文,那么只能入到字符串中, 不可是直接b'Hello,大亮'
a_str = 'Hello, 大亮'
#純ASCII字符可以直接以字節(jié)碼的形式輸出 b'Hello, Mark'
b_str = b'Hello, Mark'
#base64只能對字節(jié)碼進行編碼,所以我們需要先對str進行編碼
a = base64.b64encode(a_str.encode('utf-8'))
#由于b_str直接用字節(jié)碼表示,所以可以直接編碼
b = base64.b64encode(b_str)
#打印兩個字節(jié)碼的base64的編碼表示
print(f"<{a_str.encode('utf-8')}>'s base64 code is: <{a}>")
print(f"<{b_str}>'s base64 code is: <锐涯>")
'''
#Output:
<b'Hello, \xe5\xa4\xa7\xe4\xba\xae'>'s base64 code is: <b'SGVsbG8sIOWkp+S6rg=='>
<b'Hello, Mark'>'s base64 code is: <b'SGVsbG8sIE1hcms='>
'''
- 解碼
import base64
c = b'SGVsbG8sIOWkp+S6rg=='
d = base64.b64decode(c)
print(f"the Byte code of <{c}> is: <aqcea8w>")
print(f"the string of <ewimyia> is <{d.decode('utf-8')}>")
'''
OUTPUT:
the Byte code of <b'SGVsbG8sIOWkp+S6rg=='> is: <b'Hello, \xe5\xa4\xa7\xe4\xba\xae'>
the string of <b'Hello, \xe5\xa4\xa7\xe4\xba\xae'> is <Hello, 大亮>
'''
安全的URL base64編碼/解碼
在標準的base64編碼中可能出現(xiàn)字符+
和/
號, 但是這些符號在URL中為特殊字符, 所以base64模塊還支持"url_safe"的方式進行編碼和解碼, 其實就是將字符 +
和/
分別替換為-
和_
.
代碼
import base64
a_str = 'Hello, 大亮'
b = base64.b64encode(a_str.encode('utf-8'))
c = base64.urlsafe_b64encode(a_str.encode('utf-8'))
#標準編碼
print(b)
#url_safe編碼
print(c)
```
OUTPUT:
b'SGVsbG8sIOWkp+S6rg=='
b'SGVsbG8sIOWkp-S6rg=='
```
#解碼方法為: base64.urlbase64.urlsafe_b64decode(s)
#同樣, 解碼也是只能解碼字節(jié)碼, 不能解碼str.
同樣=
號也是URL中的關(guān)鍵符號, 所以在URL應用中, 很多情況是把編碼后的base64編碼末尾的=
號省略
如果要解碼省略了=
號的base64編碼, 我只需要判斷編碼是否能被4字節(jié)整除, 如果不能整除, 我們就可以推算出該編碼省略了幾個=
號, 我們?nèi)斯ぱa上, 再進行解碼即可
代碼如下
def safe_base64_decode(s):
n = len(s) % 4
s = s + b"=" * n
return base64.b64decode(s)
Base64的目的就是把二進行文件轉(zhuǎn)換到純文本字符串, 以便于在某些特殊場景傳輸使用, 常用場景為: URL, Cookie, http頁面.
本文內(nèi)容主要來源于廖雪峰老師的博客, 僅作為個人學習筆記