Python字符串和編碼(三)

字符編碼


  1. 計(jì)算機(jī)由于是美國人發(fā)明艇搀,因此只有127個(gè)字母編碼到計(jì)算機(jī)里啄刹,也就是大小寫英文字母忆嗜、數(shù)字和一些符號(hào)。該表又稱為ASCII編碼
  2. 中國制定了GB2312編碼來進(jìn)行中文的編進(jìn)
  3. 由于各個(gè)國家的編碼復(fù)雜性淑玫,Unicode應(yīng)運(yùn)而生巾腕,Unicode將所有的語言都統(tǒng)一到一套編碼里面面睛,這樣就不會(huì)在有亂碼出現(xiàn)。
  4. ASCII編碼和Unicode編碼的區(qū)別是:ASCII編碼是1個(gè)字節(jié)尊搬,而Unicode是通常是2個(gè)字節(jié)叁鉴。
  5. 盡管Unicode將編碼統(tǒng)一了,亂碼問題消失了佛寿,但是如果基本都是英文的話亲茅,用Unicode編碼要比ASCII編碼多一倍的存儲(chǔ)空間,在存儲(chǔ)和傳輸上是否不劃算狗准;因此又出現(xiàn)了降Unicode編碼轉(zhuǎn)化為“可變成編碼”UTF-8編碼。UTF-8編碼把一個(gè)Unicode字符根據(jù)不同的數(shù)字大小編碼成1-6個(gè)字節(jié)茵肃,常用的英文字母被編碼為1個(gè)字節(jié)腔长,漢字通常是3個(gè)字節(jié),只有很生僻的才編碼為4-6個(gè)字節(jié)验残。
  6. 現(xiàn)在計(jì)算機(jī)系統(tǒng)通用的字符編碼工作:在計(jì)算機(jī)內(nèi)存中統(tǒng)一使用Unicode捞附,而需要保存到硬盤或者傳輸?shù)臅r(shí)候,就轉(zhuǎn)換為UTF-8編碼您没;
  7. 關(guān)系例子
字符 ASCII Unicode UTF-8
A 0100000 000000001000001 01000001
x 01001110 00101101 11100100 10111000 10101101

Python字符串


  1. 在最新的Python3版本中鸟召,字符串是以Unicode編碼的,因此Python支持多種語言
  2. 對(duì)于單個(gè)字符的編碼氨鹏,Python提供了ord()函數(shù)獲取字符的整數(shù)表示欧募,chr()函數(shù)把編碼轉(zhuǎn)換為對(duì)應(yīng)的字符
  3. Python的字符串類型是str,在內(nèi)存中以Unicode表示仆抵,一個(gè)字符對(duì)應(yīng)若干個(gè)字節(jié)跟继,如果要傳輸或者保存,需要將str轉(zhuǎn)換為字節(jié)為單位bytes镣丑;對(duì)于bytes類型數(shù)據(jù)用帶b前綴的單引號(hào)或雙印好表示
  4. Pyhont提供encodedecodel兩種方式進(jìn)行字符編碼的轉(zhuǎn)換
  5. len()函數(shù)計(jì)算str是字符數(shù)舔糖,計(jì)算bytes則為字節(jié)數(shù)
  6. 為了避免亂碼問題,應(yīng)當(dāng)時(shí)鐘堅(jiān)持使用UTF-8編碼對(duì)str和bytes轉(zhuǎn)換

格式化


  1. Python的格式化方式和C語言保持一致用%實(shí)現(xiàn)
  2. 字符串里面的%是一個(gè)普通的字符則需要轉(zhuǎn)移用%%來表示%

總結(jié)


牢記采用UTF-8來編碼莺匠,亂碼將不再是問題金吗,了解了ASCII、Unicode以及UTF-8的歷史不錯(cuò)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末趣竣,一起剝皮案震驚了整個(gè)濱河市摇庙,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌遥缕,老刑警劉巖跟匆,帶你破解...
    沈念sama閱讀 212,686評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異通砍,居然都是意外死亡玛臂,警方通過查閱死者的電腦和手機(jī)烤蜕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,668評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來迹冤,“玉大人讽营,你說我怎么就攤上這事∨葆悖” “怎么了橱鹏?”我有些...
    開封第一講書人閱讀 158,160評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長堪藐。 經(jīng)常有香客問我莉兰,道長,這世上最難降的妖魔是什么礁竞? 我笑而不...
    開封第一講書人閱讀 56,736評(píng)論 1 284
  • 正文 為了忘掉前任糖荒,我火速辦了婚禮,結(jié)果婚禮上模捂,老公的妹妹穿的比我還像新娘捶朵。我一直安慰自己,他們只是感情好狂男,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,847評(píng)論 6 386
  • 文/花漫 我一把揭開白布综看。 她就那樣靜靜地躺著,像睡著了一般岖食。 火紅的嫁衣襯著肌膚如雪红碑。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 50,043評(píng)論 1 291
  • 那天泡垃,我揣著相機(jī)與錄音句喷,去河邊找鬼。 笑死兔毙,一個(gè)胖子當(dāng)著我的面吹牛唾琼,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播澎剥,決...
    沈念sama閱讀 39,129評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼锡溯,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了哑姚?” 一聲冷哼從身側(cè)響起祭饭,我...
    開封第一講書人閱讀 37,872評(píng)論 0 268
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎叙量,沒想到半個(gè)月后倡蝙,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,318評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡绞佩,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,645評(píng)論 2 327
  • 正文 我和宋清朗相戀三年寺鸥,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了猪钮。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,777評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡胆建,死狀恐怖烤低,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情笆载,我是刑警寧澤扑馁,帶...
    沈念sama閱讀 34,470評(píng)論 4 333
  • 正文 年R本政府宣布,位于F島的核電站凉驻,受9級(jí)特大地震影響腻要,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜涝登,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,126評(píng)論 3 317
  • 文/蒙蒙 一雄家、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧缀拭,春花似錦、人聲如沸填帽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,861評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽篡腌。三九已至褐荷,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間嘹悼,已是汗流浹背叛甫。 一陣腳步聲響...
    開封第一講書人閱讀 32,095評(píng)論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留杨伙,地道東北人其监。 一個(gè)月前我還...
    沈念sama閱讀 46,589評(píng)論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像限匣,于是被迫代替她去往敵國和親抖苦。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,687評(píng)論 2 351

推薦閱讀更多精彩內(nèi)容