關(guān)于python文件的字符編碼

# -*- coding: utf-8 -*-字符編碼是啥苟弛?

在弄清楚字符編碼是啥之前我們要先考慮一個問題腐魂。如果計(jì)算機(jī)最基礎(chǔ)的就是0和1,那么他們是如何識別我們輸入的英文字母和數(shù)字的后控。

下面是數(shù)學(xué)知識狂窑,我們現(xiàn)代人常用的計(jì)數(shù)方式是十進(jìn)制,就是從1數(shù)到9如果再數(shù)一個數(shù)前面就進(jìn)以為成為10.計(jì)算機(jī)最基礎(chǔ)的就是二進(jìn)制染厅,0和1數(shù)到1再網(wǎng)上書就進(jìn)一位痘绎。二進(jìn)制和十進(jìn)制是可以互相轉(zhuǎn)換的。比如二進(jìn)制10就是十進(jìn)制數(shù)字2.計(jì)算機(jī)通過二進(jìn)制可以給十進(jìn)制進(jìn)行編碼糟秘。除此之外二進(jìn)制還可以轉(zhuǎn)換成八進(jìn)制和十六進(jìn)制简逮。通過這些數(shù)學(xué)轉(zhuǎn)換,我們可以創(chuàng)建一個集合尿赚∩⑹可以理解成可以通過二級制,八進(jìn)制凌净,十進(jìn)制悲龟,十六進(jìn)制的數(shù)學(xué)關(guān)系創(chuàng)建一張對應(yīng)表。

就像下圖一樣冰寻。dec是十進(jìn)制须教,HX是十六進(jìn)制 Oct是八進(jìn)制。每一個數(shù)字都可以對應(yīng)一個字符,比如字母和數(shù)字轻腺。這樣我們就可以向計(jì)算機(jī)輸入英文了乐疆。

通過上面的表讓我們認(rèn)識到,變成本質(zhì)上就是英文和數(shù)學(xué)的結(jié)合產(chǎn)物贬养。

當(dāng)我們弄清楚計(jì)算機(jī)數(shù)學(xué)和英語的關(guān)系之后挤土,我們再來說字符編碼,說白了字符編碼就是類似上面的表误算,上面的表示ascii表仰美,為了更好的表示字符,還有很多比較強(qiáng)大的表儿礼。我們在使用記事本咖杂,word等文本編輯程序的時候,就會使用到這些字符表蚊夫。

有一種字符編碼叫做GBK诉字,這個是中文字符集,這個字符集和ascii的表感覺差不多知纷,但是由于漢子比較復(fù)雜奏窑,所以有些漢子內(nèi)容需要通過一個公式來計(jì)算。

[(GBKH-0x81)*0xBE+(GBKL-0x41)]*(漢字離散后每個漢字點(diǎn)陣所占用的字節(jié))

好吧我也不知道這個公式表達(dá)的是什么屈扎。

一般GBK只在中文軟件程序中使用,如果在英文軟件程序環(huán)境下撩匕,程序不能解析GBK那么程序就會出現(xiàn)亂碼鹰晨。

為了保證所有的程序環(huán)境都可以正常顯示文字,就出現(xiàn)了UTF-8止毕。這個字符編碼可以很好的兼容中文英文模蜡,python默認(rèn)就會讀取UTF-8字符編碼的文件。

那我們?nèi)绾卧O(shè)置字符編碼扁凛?

如果你和我一樣的文本編輯器可以在菜單中找到這個選項(xiàng)忍疾,然后你發(fā)現(xiàn)有很多字符編碼可以選擇。

除此之外谨朝,我們還可以使用下面這行代碼來讓python使用utf-8的模式來讀取這個文件卤妒。

# -*- coding: utf-8 -*-

就是告訴python我的文件要用utf-8字符集來解析。

在未來的變成當(dāng)中字币,html则披,java都會遇到很多字符編碼的問題,一般文字出現(xiàn)亂碼都是字符編碼的問題洗出。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末士复,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子翩活,更是在濱河造成了極大的恐慌阱洪,老刑警劉巖便贵,帶你破解...
    沈念sama閱讀 207,248評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異冗荸,居然都是意外死亡承璃,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評論 2 381
  • 文/潘曉璐 我一進(jìn)店門俏竞,熙熙樓的掌柜王于貴愁眉苦臉地迎上來绸硕,“玉大人,你說我怎么就攤上這事魂毁〔E澹” “怎么了?”我有些...
    開封第一講書人閱讀 153,443評論 0 344
  • 文/不壞的土叔 我叫張陵席楚,是天一觀的道長咬崔。 經(jīng)常有香客問我,道長烦秩,這世上最難降的妖魔是什么垮斯? 我笑而不...
    開封第一講書人閱讀 55,475評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮只祠,結(jié)果婚禮上兜蠕,老公的妹妹穿的比我還像新娘。我一直安慰自己抛寝,他們只是感情好熊杨,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,458評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著盗舰,像睡著了一般晶府。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上钻趋,一...
    開封第一講書人閱讀 49,185評論 1 284
  • 那天川陆,我揣著相機(jī)與錄音,去河邊找鬼蛮位。 笑死较沪,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的失仁。 我是一名探鬼主播购对,決...
    沈念sama閱讀 38,451評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼陶因!你這毒婦竟也來了骡苞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,112評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎解幽,沒想到半個月后贴见,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,609評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡躲株,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,083評論 2 325
  • 正文 我和宋清朗相戀三年片部,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片霜定。...
    茶點(diǎn)故事閱讀 38,163評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡档悠,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出望浩,到底是詐尸還是另有隱情辖所,我是刑警寧澤,帶...
    沈念sama閱讀 33,803評論 4 323
  • 正文 年R本政府宣布磨德,位于F島的核電站缘回,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏典挑。R本人自食惡果不足惜酥宴,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,357評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望您觉。 院中可真熱鬧拙寡,春花似錦、人聲如沸琳水。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,357評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽炫刷。三九已至,卻和暖如春郁妈,著一層夾襖步出監(jiān)牢的瞬間浑玛,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,590評論 1 261
  • 我被黑心中介騙來泰國打工噩咪, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留顾彰,地道東北人。 一個月前我還...
    沈念sama閱讀 45,636評論 2 355
  • 正文 我出身青樓胃碾,卻偏偏與公主長得像涨享,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子仆百,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,925評論 2 344

推薦閱讀更多精彩內(nèi)容