Base64編碼和解碼原理及模塊應用

背景介紹

  • base64的作用是以可見字符的形式對非純文本文件進行編碼轉(zhuǎn)換, 簡而言之就是用可見字符集中的字符替換原有的二進制文件.

  • base64編碼之所以叫base64是因為這個<可見字符集>是由64個可見字符構(gòu)成.例如:

    • ['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '-', '/']

工作原理

  • 對原有二進制數(shù)據(jù)進行分組, 分組方式為第三個Byte為一組, 也就是說一組為24個bit.
  • 對每組的24個bit(3Byte)再進行分組,分為4組, 每組6個bit.
  • 因為每組是6個bit, 那么6個bit的二進制序列最多表示64種可能性, 正好由我們的<可見字符集>中的字符表示每種序列.
  • 如果原有二進制數(shù)據(jù)不是3Byte的整數(shù)倍, 那么剩下的1個或2個byte 我們使用\x00進行補充,然后再蠔編碼, 我們會發(fā)現(xiàn)行尾加上一個或兩個= 號,代表表示補充了多少字節(jié)\x00
base64分組示意圖

代碼示例

  • 編碼
import base64

#如果有中文,那么只能入到字符串中, 不可是直接b'Hello,大亮'
a_str = 'Hello, 大亮'
#純ASCII字符可以直接以字節(jié)碼的形式輸出 b'Hello, Mark'
b_str = b'Hello, Mark'
#base64只能對字節(jié)碼進行編碼,所以我們需要先對str進行編碼
a = base64.b64encode(a_str.encode('utf-8'))
#由于b_str直接用字節(jié)碼表示,所以可以直接編碼
b = base64.b64encode(b_str)

#打印兩個字節(jié)碼的base64的編碼表示
print(f"<{a_str.encode('utf-8')}>'s base64 code is: <{a}>")
print(f"<{b_str}>'s base64 code is: <锐涯>")

'''
#Output:
<b'Hello, \xe5\xa4\xa7\xe4\xba\xae'>'s base64 code is: <b'SGVsbG8sIOWkp+S6rg=='>
<b'Hello, Mark'>'s base64 code is: <b'SGVsbG8sIE1hcms='>
'''
  • 解碼
import base64
c = b'SGVsbG8sIOWkp+S6rg=='
d = base64.b64decode(c)
print(f"the Byte code of <{c}> is: <aqcea8w>")
print(f"the string of <ewimyia> is <{d.decode('utf-8')}>")

'''
OUTPUT:
the Byte code of <b'SGVsbG8sIOWkp+S6rg=='> is: <b'Hello, \xe5\xa4\xa7\xe4\xba\xae'>
the string of <b'Hello, \xe5\xa4\xa7\xe4\xba\xae'> is <Hello, 大亮>
'''

安全的URL base64編碼/解碼

在標準的base64編碼中可能出現(xiàn)字符+/ 號, 但是這些符號在URL中為特殊字符, 所以base64模塊還支持"url_safe"的方式進行編碼和解碼, 其實就是將字符 +/分別替換為-_ .

代碼

import base64
a_str = 'Hello, 大亮'

b = base64.b64encode(a_str.encode('utf-8'))
c = base64.urlsafe_b64encode(a_str.encode('utf-8'))
#標準編碼
print(b)
#url_safe編碼
print(c)

```
OUTPUT:
b'SGVsbG8sIOWkp+S6rg=='
b'SGVsbG8sIOWkp-S6rg=='
```
#解碼方法為:  base64.urlbase64.urlsafe_b64decode(s)   
#同樣, 解碼也是只能解碼字節(jié)碼, 不能解碼str.

同樣=號也是URL中的關(guān)鍵符號, 所以在URL應用中, 很多情況是把編碼后的base64編碼末尾的=號省略

如果要解碼省略了=號的base64編碼, 我只需要判斷編碼是否能被4字節(jié)整除, 如果不能整除, 我們就可以推算出該編碼省略了幾個=號, 我們?nèi)斯ぱa上, 再進行解碼即可

代碼如下

def safe_base64_decode(s):
    n = len(s) % 4
    s = s + b"=" * n
    return base64.b64decode(s)

Base64的目的就是把二進行文件轉(zhuǎn)換到純文本字符串, 以便于在某些特殊場景傳輸使用, 常用場景為: URL, Cookie, http頁面.

本文內(nèi)容主要來源于廖雪峰老師的博客, 僅作為個人學習筆記

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末曲饱,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子佳镜,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡待秃,警方通過查閱死者的電腦和手機拜秧,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來章郁,“玉大人枉氮,你說我怎么就攤上這事∨” “怎么了聊替?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長培廓。 經(jīng)常有香客問我惹悄,道長,這世上最難降的妖魔是什么肩钠? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任泣港,我火速辦了婚禮暂殖,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘当纱。我一直安慰自己呛每,他們只是感情好,可當我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布坡氯。 她就那樣靜靜地躺著晨横,像睡著了一般。 火紅的嫁衣襯著肌膚如雪箫柳。 梳的紋絲不亂的頭發(fā)上手形,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天,我揣著相機與錄音滞时,去河邊找鬼叁幢。 笑死,一個胖子當著我的面吹牛坪稽,可吹牛的內(nèi)容都是我干的曼玩。 我是一名探鬼主播,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼窒百,長吁一口氣:“原來是場噩夢啊……” “哼黍判!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起篙梢,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤顷帖,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后渤滞,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體贬墩,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年妄呕,在試婚紗的時候發(fā)現(xiàn)自己被綠了陶舞。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡绪励,死狀恐怖肿孵,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情疏魏,我是刑警寧澤停做,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站大莫,受9級特大地震影響蛉腌,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一眉抬、第九天 我趴在偏房一處隱蔽的房頂上張望贯吓。 院中可真熱鬧,春花似錦蜀变、人聲如沸悄谐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽爬舰。三九已至,卻和暖如春寒瓦,著一層夾襖步出監(jiān)牢的瞬間情屹,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工杂腰, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留垃你,地道東北人。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓喂很,卻偏偏與公主長得像惜颇,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子少辣,可洞房花燭夜當晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 每個文本編輯器都有默認的編碼方式(比如 UTF-8 編碼)凌摄,當我們保存文檔的時候,可以選擇編碼方式漓帅,如果沒有特意選...
    _于曼麗_閱讀 1,522評論 0 1
  • Base64編碼由來 Base64最早是用來解決電子郵件的傳輸問題锨亏。 傳統(tǒng)的電子郵件是1982年定下技術(shù)規(guī)范的,詳...
    Ashton閱讀 2,581評論 0 6
  • 了解CTF的朋友們乾翔,肯定對一種題型不陌生——Misc,Misc里面有各種各樣的編碼弓乙,眼花繚亂的文本通過層層解碼后得...
    Ackerzy閱讀 11,783評論 1 30
  • 經(jīng)常聽到有人說:我想考駕照暇韧,我想考會計,我想學英語浓瞪,我想怎么怎么樣懈玻。身邊經(jīng)常會有這樣的人,不止一次的聽到他想做什么...
    黑夜的貓兒閱讀 1,202評論 1 4
  • 親愛的兜乾颁, 今天去上課的路上涂乌,我們做了一道數(shù)學題艺栈,一道關(guān)于幸福的數(shù)學題。我問你一天24小時湾盒,你有多少時間是幸福的湿右?...
    蔡新花閱讀 202評論 1 0