什么是字符編碼

什么是字符編碼

字符集

簡單的說字符集就是一張表奕枢,一張存儲了文字和二進制對應(yīng)的表挣郭。
我們知道計算機存儲信息都是以二進制來存儲的,那么二進制又是用來表示我們所熟知的文字或者符號呢钠至?這就需要一個表來標注好對應(yīng)關(guān)系近哟。在以前我們擁有很多的字符集,因為每個國家的字符都不太一樣钱豁,都是各自為營制作字符集耻卡。后來有組織為了統(tǒng)一各個國家的字符,制作了Unicode 字符集牲尺,Unicode1.0版本在1991年10月發(fā)布卵酪。

我們來看一下GB2312簡體中文編碼表
這里列出一部分表:

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A1A0 谤碳。 · ˉ ˇ ¨
A1B0
A1C0 ± × ÷

其中溃卡、 這個對應(yīng)的編碼是A1A2
上面給出的是中國的GB2312編碼,但只適用于中文漢字蜒简。世界上有許多的語言瘸羡,為了統(tǒng)一標準就有人做一個字符集來包含幾乎所有的語言。這就是Unicode

字符編碼

編碼和字符集的不同在于搓茬,編碼其實是一種算法犹赖。
那既然我們已經(jīng)有了字符集了队他,為什么我們還需要字符編碼呢?
理論上我們其實只需要在計算機中存儲Unicode 這個字符集就夠了峻村。但實際情況是怎么樣的呢麸折?
舉個例子,我們存儲a 這個字母雀哨。Unicode字符集和UTF-8存儲對比

Unicode 00000000 00000000 00000000 0110001
UTF-8 01100001

我們發(fā)現(xiàn)UTF-8占的空間要少的多磕谅。
實際情況是因為那個時候的計算機存儲不像現(xiàn)在有這么大,為了考慮到存儲空間的限制雾棺,我們需要一個算法來減少字符集的存儲空間〔布校現(xiàn)在我們一直使用的UTF-8 就是字符編碼。

字符集和字符編碼的關(guān)系

像我們上文所說的 UnicodeUTF-8 捌浩,Unicode 是幾乎涵蓋了各個國家的文字和字符放刨,UTF-8 則是目前用的最廣的字符編碼。UTF-8是為了減少Unicode的存儲空間而設(shè)計的一種算法尸饺。

參考

字符編碼
十分鐘搞清字符集和字符編碼
字符集和字符編碼
字符集歷史和亂碼問題(一)
字符集歷史和亂碼問題(二)

本博客著作權(quán)歸從這到那所有进统,轉(zhuǎn)載請注明出處
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市浪听,隨后出現(xiàn)的幾起案子螟碎,更是在濱河造成了極大的恐慌,老刑警劉巖迹栓,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件掉分,死亡現(xiàn)場離奇詭異,居然都是意外死亡克伊,警方通過查閱死者的電腦和手機酥郭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來愿吹,“玉大人不从,你說我怎么就攤上這事±绻颍” “怎么了椿息?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長坷衍。 經(jīng)常有香客問我撵颊,道長,這世上最難降的妖魔是什么惫叛? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任倡勇,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘妻熊。我一直安慰自己夸浅,他們只是感情好,可當我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布扔役。 她就那樣靜靜地躺著帆喇,像睡著了一般。 火紅的嫁衣襯著肌膚如雪亿胸。 梳的紋絲不亂的頭發(fā)上坯钦,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天,我揣著相機與錄音侈玄,去河邊找鬼婉刀。 笑死,一個胖子當著我的面吹牛序仙,可吹牛的內(nèi)容都是我干的突颊。 我是一名探鬼主播,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼潘悼,長吁一口氣:“原來是場噩夢啊……” “哼律秃!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起治唤,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤棒动,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后宾添,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體迁客,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年辞槐,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片粘室。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡榄檬,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出衔统,到底是詐尸還是另有隱情鹿榜,我是刑警寧澤,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布锦爵,位于F島的核電站舱殿,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏险掀。R本人自食惡果不足惜沪袭,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望樟氢。 院中可真熱鬧冈绊,春花似錦侠鳄、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至毅该,卻和暖如春博秫,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背眶掌。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工挡育, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人畏线。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓静盅,卻偏偏與公主長得像,于是被迫代替她去往敵國和親寝殴。 傳聞我的和親對象是個殘疾皇子蒿叠,可洞房花燭夜當晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 一、前言 一直以來蚣常,都對字符編碼有一個較模糊的概念市咽,更談不上懂得其中的原理。本文記錄自己對字符編碼的學(xué)習(xí)抵蚊。 二施绎、概...
    青鳴閱讀 2,159評論 0 0
  • 計算機是如何存儲數(shù)據(jù)的 在談什么是字符編碼前,我們首先要知道一個概念贞绳,計算機是如何存儲數(shù)據(jù)的:計算機是由邏輯電路組...
    七里之境閱讀 279評論 0 1
  • 自從喜歡上了心理學(xué)冈闭,我就不自覺地去探索每個人的心靈俱尼,或者是感受自己內(nèi)心的變化,讀一些別人的小說萎攒,感受文字底下的人...
    MinzeTeng閱讀 369評論 0 1
  • 年少時的我們是不會相信命運耍休,就像一首歌唱的那樣:三分天注定刃永,七分考打拼,愛拼羊精,才會贏斯够。只是女人如果在感情途中拼到無...
    敏視界閱讀 343評論 0 0