Python——Unicode字符串

字符串還有一個編碼問題茉唉。

因為計算機只能處理數字较雕,如果要處理文本,就必須先把文本轉換為數字才能處理食拜。最早的計算機在設計時采用8個比特(bit)作為一個字節(jié)(byte)鸵熟,所以,一個字節(jié)能表示的最大的整數就是255(二進制11111111=十進制255)负甸,0 - 255被用來表示大小寫英文字母流强、數字和一些符號痹届,這個編碼表被稱為ASCII編碼,比如大寫字母A的編碼是65打月,小寫字母z的編碼是122队腐。

如果要表示中文,顯然一個字節(jié)是不夠的奏篙,至少需要兩個字節(jié)柴淘,而且還不能和ASCII編碼沖突,所以报破,中國制定了GB2312編碼悠就,用來把中文編進去。

類似的充易,日文和韓文等其他語言也有這個問題梗脾。為了統(tǒng)一所有文字的編碼,Unicode應運而生盹靴。Unicode把所有語言都統(tǒng)一到一套編碼里炸茧,這樣就不會再有亂碼問題了。

Unicode通常用兩個字節(jié)表示一個字符稿静,原有的英文編碼從單字節(jié)變成雙字節(jié)梭冠,只需要把高字節(jié)全部填為0就可以。

因為Python的誕生比Unicode標準發(fā)布的時間還要早改备,所以最早的Python只支持ASCII編碼控漠,普通的字符串'ABC'在Python內部都是ASCII編碼的。

Python在后來添加了對Unicode的支持悬钳,以Unicode表示的字符串用u'...'表示盐捷,比如:

print u'中文'

中文

注意:不加 u ,中文就不能正常顯示默勾。

Unicode字符串除了多了一個u之外碉渡,與普通字符串沒啥區(qū)別,轉義字符和多行表示法仍然有效:

轉義:

u'中文\n日文\n韓文'

多行:

u'''第一行

第二行'''

raw+多行:

ur'''Python的Unicode字符串支持"中文",

"日文",

"韓文"等多種語言'''

如果中文字符串在Python環(huán)境下遇到 UnicodeDecodeError母剥,這是因為.py文件保存的格式有問題滞诺。可以在第一行添加注釋

# -*- coding: utf-8 -*-

目的是告訴Python解釋器环疼,用UTF-8編碼讀取源代碼习霹。然后用Notepad++ 另存為... 并選擇UTF-8格式保存。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末炫隶,一起剝皮案震驚了整個濱河市淋叶,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌等限,老刑警劉巖爸吮,帶你破解...
    沈念sama閱讀 211,496評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異望门,居然都是意外死亡形娇,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,187評論 3 385
  • 文/潘曉璐 我一進店門筹误,熙熙樓的掌柜王于貴愁眉苦臉地迎上來桐早,“玉大人,你說我怎么就攤上這事厨剪『逶停” “怎么了?”我有些...
    開封第一講書人閱讀 157,091評論 0 348
  • 文/不壞的土叔 我叫張陵祷膳,是天一觀的道長陶衅。 經常有香客問我,道長直晨,這世上最難降的妖魔是什么搀军? 我笑而不...
    開封第一講書人閱讀 56,458評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮勇皇,結果婚禮上罩句,老公的妹妹穿的比我還像新娘。我一直安慰自己敛摘,他們只是感情好门烂,可當我...
    茶點故事閱讀 65,542評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著兄淫,像睡著了一般屯远。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上拖叙,一...
    開封第一講書人閱讀 49,802評論 1 290
  • 那天氓润,我揣著相機與錄音,去河邊找鬼薯鳍。 笑死咖气,一個胖子當著我的面吹牛,可吹牛的內容都是我干的挖滤。 我是一名探鬼主播崩溪,決...
    沈念sama閱讀 38,945評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼斩松!你這毒婦竟也來了伶唯?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,709評論 0 266
  • 序言:老撾萬榮一對情侶失蹤惧盹,失蹤者是張志新(化名)和其女友劉穎乳幸,沒想到半個月后瞪讼,有當地人在樹林里發(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 44,158評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡粹断,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,502評論 2 327
  • 正文 我和宋清朗相戀三年符欠,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瓶埋。...
    茶點故事閱讀 38,637評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡希柿,死狀恐怖,靈堂內的尸體忽然破棺而出养筒,到底是詐尸還是另有隱情曾撤,我是刑警寧澤,帶...
    沈念sama閱讀 34,300評論 4 329
  • 正文 年R本政府宣布晕粪,位于F島的核電站挤悉,受9級特大地震影響,放射性物質發(fā)生泄漏兵多。R本人自食惡果不足惜尖啡,卻給世界環(huán)境...
    茶點故事閱讀 39,911評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望剩膘。 院中可真熱鬧衅斩,春花似錦、人聲如沸怠褐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,744評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽奈懒。三九已至奠涌,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間磷杏,已是汗流浹背溜畅。 一陣腳步聲響...
    開封第一講書人閱讀 31,982評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留极祸,地道東北人慈格。 一個月前我還...
    沈念sama閱讀 46,344評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像遥金,于是被迫代替她去往敵國和親浴捆。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,500評論 2 348

推薦閱讀更多精彩內容