【Python自學】03.字符串和編碼（上）

打了雞血鞋吉，一天二更
　　　　　

動態(tài)圖嘗試上傳ing

　　之前也說過字符串是一種數(shù)據(jù)類型绎晃，但是它比較特殊，主要是因為編碼問題柏靶。既然如此物邑，先搞清楚下計算機編碼的相關(guān)內(nèi)容溜哮。

計算機編碼

只處理數(shù)字，要處理文本就得先把文本轉(zhuǎn)為數(shù)字才能處理色解。
早期設(shè)計 8 bit 表示一個字節(jié)茂嗓，一字節(jié)表示最大整數(shù) 11111111=十進制255
兩字節(jié)可表示最大65535，四字節(jié)4294967295
世界上有上百種語言科阎，不同的國家可能有不同的標準述吸，例如 ASCII 和 GB

ASCII編碼：

美國人最早只把127個字母編碼進計算機去，大小寫英文字母锣笨、數(shù)字和符號蝌矛。例如大寫 A 編碼 65，小寫 z 編碼是122错英。

GB2312編碼：

我國為了計算機處理中文（需要至少兩個字節(jié)）入撒，創(chuàng)建的一種與 ASCII 編碼不沖突的編碼。

Unicode標準/編碼

因為各國標準不一椭岩，創(chuàng)的編碼也許完全不同茅逮，所以會不可避免地出現(xiàn)沖突璃赡，結(jié)果就是在多語言混合的文本當中，顯示出來一堆的亂碼献雅。于是乎碉考，Unicode標準就是在此時應運而生，將所有語言統(tǒng)一到一套編碼里面挺身。

常用兩個字節(jié)表示一個字符侯谁，非常偏僻的字符用上 4 個
現(xiàn)代大多數(shù)操作系統(tǒng)和編程語言都支持該編碼

ASCII與Unicode的區(qū)別：

ASCII編碼是 1 字節(jié)，而Unicode通常是2字節(jié)
ASCII編碼中章钾，A 是十進制的65（010000001）良蒸，字符 0 是十進制的48（00110000）（注意‘0’和0不同）。漢字已經(jīng)超出 ASCII 編碼范圍伍玖，而 Unicode 的十進制是20013（01001110 00101101）
如果要將 ASCII 編碼中的 A 改為 Unicode 編碼，前面補 0 即可：00000000 01000001

UTF-8編碼：

如果全是用 Unicode 編碼剿吻，亂碼解決了窍箍，但是寫的文本全英，用 Unicode 編碼比 ASCII 編碼需要多一倍的存儲空間丽旅，在存儲和傳輸上就非常不劃算椰棘。于是乎節(jié)約版“可變長編碼”UTF-8又橫空出世。
把 Unicode 字符根據(jù)不同數(shù)字大小編寫成 1-6 個字節(jié)：　　　　
　　常用英文字幕編成１字節(jié)
漢字通常編寫成3個字節(jié)榄笙，很生僻的字符編寫成 4-6 個字節(jié)
優(yōu)點：
　　如果傳輸?shù)奈谋景罅坑⑽淖址澳瑢⒐?jié)省大部分空間
　　大量支持 ASCII 編碼的歷史遺留軟件可以在 UTF-8 編碼下繼續(xù)工作。

目前計算機系統(tǒng)通用的字符編碼工作方式

在計算機內(nèi)存中茅撞，統(tǒng)一使用 Unicode 編碼帆卓，當需要保存到硬盤或者傳輸?shù)臅r候就轉(zhuǎn)換成為 UTF-8 編碼。
使用筆記本編輯時：
　　　　　　　　　　

讀取時UTF-8轉(zhuǎn)換成Unicode米丘，保存時相反
瀏覽器：
　　　　　　　　　　

瀏覽網(wǎng)頁的時候剑令，服務器會把動態(tài)生成的Unicode內(nèi)容轉(zhuǎn)換為UTF-8再傳輸?shù)綖g覽器

　　很多網(wǎng)頁上的源碼有類似<meta charset="UTF-8" />的信息，表示該網(wǎng)頁正是用的 UTF-8 編碼拄查。

好多文字...基本上搬過來了吁津，嘛，隨便看看得了
　　

反正又沒有說要考試

最后編輯于：2017.12.11 05:23:43

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末堕扶，一起剝皮案震驚了整個濱河市碍脏，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌稍算，老刑警劉巖典尾，帶你破解...
沈念sama閱讀 212,686評論 6贊 492
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異邪蛔，居然都是意外死亡急黎，警方通過查閱死者的電腦和手機扎狱，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,668評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來勃教，“玉大人淤击，你說我怎么就攤上這事」试矗” “怎么了污抬？”我有些...
開封第一講書人閱讀 158,160評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長绳军。經(jīng)常有香客問我印机，道長，這世上最難降的妖魔是什么门驾？我笑而不...
開封第一講書人閱讀 56,736評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任射赛，我火速辦了婚禮，結(jié)果婚禮上奶是，老公的妹妹穿的比我還像新娘楣责。我一直安慰自己翔烁，他們只是感情好穿扳，可當我...
茶點故事閱讀 65,847評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著蜒蕾，像睡著了一般及汉。火紅的嫁衣襯著肌膚如雪沮趣。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 50,043評論 1贊 291
城市分裂傳說
那天坷随，我揣著相機與錄音房铭，去河邊找鬼。笑死甸箱，一個胖子當著我的面吹牛育叁，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播芍殖，決...
沈念sama閱讀 39,129評論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼豪嗽，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了豌骏？” 一聲冷哼從身側(cè)響起龟梦，我...
開封第一講書人閱讀 37,872評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎窃躲，沒想到半個月后计贰，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,318評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡蒂窒，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,645評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年躁倒，在試婚紗的時候發(fā)現(xiàn)自己被綠了荞怒。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,777評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡秧秉，死狀恐怖褐桌，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情象迎，我是刑警寧澤荧嵌，帶...
沈念sama閱讀 34,470評論 4贊 333
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站砾淌，受9級特大地震影響啦撮，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜汪厨，卻給世界環(huán)境...
茶點故事閱讀 40,126評論 3贊 317
男人毒藥：我在死后第九天來索命
文/蒙蒙一赃春、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧劫乱，春花似錦聘鳞、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,861評論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽站楚。三九已至脱惰，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間窿春，已是汗流浹背拉一。一陣腳步聲響...
開封第一講書人閱讀 32,095評論 1贊 267
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留旧乞，地道東北人蔚润。一個月前我還...
沈念sama閱讀 46,589評論 2贊 362
代替公主和親
正文我出身青樓，卻偏偏與公主長得像尺栖，于是被迫代替她去往敵國和親嫡纠。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 43,687評論 2贊 351