文件編碼介紹:Gentoo下打開windows txt文件中文亂碼問題

Linux與Windows系統(tǒng)語言編碼區(qū)別

在Linux操作系統(tǒng)下际插,我們有時打開在windows下的txt文件周瞎,發(fā)現(xiàn)在windows下能正常顯示的txt文件出現(xiàn)了中文亂碼说搅。
出現(xiàn)這種情況的原因為兩種操作系統(tǒng)的中文字符編碼方式(壓縮方式)不同,在windows環(huán)境中中文字符編碼一般為gbk胡桃,而在linux環(huán)境中為utf8食绿,這就導致了在windows下能正常顯示txt文件在linux環(huán)境下打開呈現(xiàn)了亂碼狀態(tài)侈咕。

系統(tǒng)編碼設置

locale.gen文件

# /etc/locale.gen: list all of the locales you want to have on your system
#
# The format of each line:
# <locale> <charmap>
#
# Where <locale> is a locale located in /usr/share/i18n/locales/ and
# where <charmap> is a charmap located in /usr/share/i18n/charmaps/.
#
# All blank lines and lines starting with # are ignored.
#
# For the default list of supported combinations, see the file:
# /usr/share/i18n/SUPPORTED
#
# Whenever glibc is emerged, the locales listed here will be automatically
# rebuilt for you.  After updating this file, you can simply run `locale-gen`
# yourself instead of re-emerging glibc.
en_US.UTF-8 UTF-8
zh_CN.UTF-8 UTF-8
  • 查看系統(tǒng)語言編碼種類
    /usr/share/i18n/locales/目錄下包含系統(tǒng)支持的編碼語言種類
gentoo ~ # ls /usr/share/i18n/locales/
en_US       en_GB     en_HK    
zh_CN       zh_TW     zh_HK
ja_JP       de_DE     ......
gentoo ~ # 
  • 查看字符編碼壓縮方式
    /usr/share/i18n/charmaps/目錄下包含系統(tǒng)支持的字符編碼方式
ls /usr/share/i18n/charmaps/
ANSI_X3.110-1983.gz    IBM1026.gz         ISO-8859-16.gz
ANSI_X3.4-1968.gz      IBM1047.gz         ISO_8859-1,GL.gz
ARMSCII-8.gz           IBM1124.gz         ISO-8859-1.gz
ASMO_449.gz            IBM1129.gz         ISO-8859-2.gz
GB18030.gz             ISIRI-3342.gz      SAMI.gz
GB_1988-80.gz          ISO_10367-BOX.gz   SAMI-WS2.gz
GB2312.gz              ISO_10646.gz       SEN_850200_B.gz
GBK.gz                 ISO_11548-1.gz     SEN_850200_C.
HP-ROMAN9.gz           ISO_6937.gz        UTF-8.gz
......
  • enca查看文件編碼方式
enca -L zh_CN file    ###檢查文件的編碼

解決方案

  • 使用iconv命令進行文件編碼轉換,如亂碼文件名為hello.txt器紧,那么在終端輸入如下命令:
iconv -f gbk -t utf8 hello.txt > hello.utf8.txt 
  • 使用enca命令轉換:
enca -L zh_CN -x UTF-8 hello.utf8.txt      ###將文件編碼轉換為"UTF-8"編碼
enca -L zh_CN -x gbk hello.txt     ###將文件編碼轉換為"gbk"編碼

enca有一個好處,如果文件本來就是你要轉換的那種編碼耀销,它不會報錯,還是會print出結果來铲汪, 而”iconv”則會報錯熊尉。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末罐柳,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子狰住,更是在濱河造成了極大的恐慌硝清,老刑警劉巖,帶你破解...
    沈念sama閱讀 223,126評論 6 520
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件转晰,死亡現(xiàn)場離奇詭異芦拿,居然都是意外死亡,警方通過查閱死者的電腦和手機查邢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,421評論 3 400
  • 文/潘曉璐 我一進店門蔗崎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人扰藕,你說我怎么就攤上這事缓苛。” “怎么了邓深?”我有些...
    開封第一講書人閱讀 169,941評論 0 366
  • 文/不壞的土叔 我叫張陵未桥,是天一觀的道長。 經(jīng)常有香客問我芥备,道長冬耿,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,294評論 1 300
  • 正文 為了忘掉前任萌壳,我火速辦了婚禮亦镶,結果婚禮上,老公的妹妹穿的比我還像新娘袱瓮。我一直安慰自己缤骨,他們只是感情好,可當我...
    茶點故事閱讀 69,295評論 6 398
  • 文/花漫 我一把揭開白布尺借。 她就那樣靜靜地躺著绊起,像睡著了一般。 火紅的嫁衣襯著肌膚如雪燎斩。 梳的紋絲不亂的頭發(fā)上虱歪,一...
    開封第一講書人閱讀 52,874評論 1 314
  • 那天,我揣著相機與錄音瘫里,去河邊找鬼实蔽。 笑死,一個胖子當著我的面吹牛谨读,可吹牛的內容都是我干的局装。 我是一名探鬼主播,決...
    沈念sama閱讀 41,285評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼铐尚!你這毒婦竟也來了拨脉?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 40,249評論 0 277
  • 序言:老撾萬榮一對情侶失蹤宣增,失蹤者是張志新(化名)和其女友劉穎玫膀,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體爹脾,經(jīng)...
    沈念sama閱讀 46,760評論 1 321
  • 正文 獨居荒郊野嶺守林人離奇死亡帖旨,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,840評論 3 343
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了灵妨。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片解阅。...
    茶點故事閱讀 40,973評論 1 354
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖泌霍,靈堂內的尸體忽然破棺而出货抄,到底是詐尸還是另有隱情,我是刑警寧澤朱转,帶...
    沈念sama閱讀 36,631評論 5 351
  • 正文 年R本政府宣布蟹地,位于F島的核電站,受9級特大地震影響藤为,放射性物質發(fā)生泄漏怪与。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,315評論 3 336
  • 文/蒙蒙 一凉蜂、第九天 我趴在偏房一處隱蔽的房頂上張望琼梆。 院中可真熱鬧,春花似錦窿吩、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,797評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至倾哺,卻和暖如春轧邪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背羞海。 一陣腳步聲響...
    開封第一講書人閱讀 33,926評論 1 275
  • 我被黑心中介騙來泰國打工忌愚, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人却邓。 一個月前我還...
    沈念sama閱讀 49,431評論 3 379
  • 正文 我出身青樓硕糊,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子简十,可洞房花燭夜當晚...
    茶點故事閱讀 45,982評論 2 361

推薦閱讀更多精彩內容

  • 編碼問題一直困擾著開發(fā)人員檬某,尤其在 Java 中更加明顯,因為 Java 是跨平臺語言螟蝙,不同平臺之間編碼之間的切換...
    x360閱讀 2,483評論 1 20
  • 在學習tkinter庫時恢恼,自己碼了一個簡單的文件搜索GUI。具體功能是輸入關鍵字胰默、文件類型和所要搜索的文件夾路徑场斑,...
    southpaw閱讀 1,720評論 0 3
  • 為什么要編碼 不知道大家有沒有想過一個問題,那就是為什么要編碼牵署?我們能不能不編碼漏隐?要回答這個問題必須要回到計算機是...
    艾小天兒閱讀 17,362評論 0 2
  • 沒有人能替你承受苦痛 不管是心靈的還是肉體的 好痛 什么時候是個頭
    蜜特閱讀 107評論 0 0
  • 西邊暗紅色的太陽漸漸悄無聲息的融入了地平線,由于火車晚點碟刺,差點沒有趕上回家的806號末班車上锁保,售票員熟練的售賣著車...
    當作夢I寫成真閱讀 177評論 0 0