Windows到Linux文件編碼轉(zhuǎn)換--一文解決亂碼問題

Windows中默認(rèn)的文件格式是GBK(gb2312)疗涉，而Linux 一般都是UTF-8。當(dāng)文件中有中文字符時吟秩，在一個系統(tǒng)中能正常顯示中文的，到另一個系統(tǒng)下常常會出現(xiàn)亂碼绽淘。本文主要介紹兩個系統(tǒng)下的編碼轉(zhuǎn)換解決中文亂碼的問題涵防。

亂碼問題的由來

計算機內(nèi)部是用"0"和"1"來表示信息的，那么如何用一串“0”和“1”來表示不同的字符呢沪铭，這就需要制定標(biāo)準(zhǔn)的編碼方案壮池，比如用“1000001”來代表字符“A”，用“110000”來代表字符“0”杀怠。這種編碼標(biāo)準(zhǔn)化方案稱為ASCII碼椰憋，是美國在1961年提出的，并成為了國際標(biāo)準(zhǔn)赔退。標(biāo)準(zhǔn) ASCII 碼使用 7 個二進(jìn)位對字符進(jìn)行編碼橙依，能表示常用的英文字母、數(shù)字硕旗、標(biāo)點符號等窗骑。因此英文也成為了計算機世界的通用語言。

由于ASCII碼只用了7 bit漆枚，所以ASCII碼最多能表示128個字符创译，多出來的那一個bit位不是浪費了嗎？不用擔(dān)心墙基，ISO標(biāo)準(zhǔn)化組織利用這最高位的bit位重新進(jìn)行了字符編碼软族，稱為ISO-8859-1編碼，最多能表示256個字符残制，前面0～127的字符編碼跟ASCII碼一樣立砸，保持兼容性，后面的128～255用來表示一些新的字符痘拆。Latin1是ISO-8859-1的別名仰禽，有些環(huán)境下也寫作Latin-1，在很多協(xié)議上纺蛆，默認(rèn)使用該編碼吐葵。

那么非英文國家的人怎么使用計算機表示非英文字符呢，這就跟某城市7位電話號碼不夠用就升8位類似桥氏，用更多位的二進(jìn)制數(shù)來表示非英文字符温峭，比如我們國家就用2個字節(jié)來對漢字進(jìn)行編碼，稱為GB2312字支。

然而問題產(chǎn)生了凤藏，不同國家都用2個字節(jié)對本國語言進(jìn)行編碼奸忽，編碼不通用，同一串二進(jìn)制編碼在不同國家代表不同的字符揖庄，真夠亂的栗菜。為了解決非英文字符編碼方案的統(tǒng)一問題，產(chǎn)生了Unicode蹄梢。Unicode編碼就像是一個翻譯疙筹，每個語言自己的編碼會一一對應(yīng)到某個Unicode碼，這樣就把編碼統(tǒng)一起來了禁炒，不管你說什么語言而咆，用Unicode總歸不會成亂碼。為了統(tǒng)一編碼幕袱，Unicode用4個字節(jié)來表示一個字符暴备，從而導(dǎo)致編碼效率非常低，讓人無法忍受们豌。

為了提高Unicode的編碼效率涯捻，通過改進(jìn)Unicode編碼產(chǎn)生了UTF-8編碼。UTF-8使用1-4個字節(jié)進(jìn)行編碼玛痊，可以根據(jù)不同的符號自動選擇編碼的長短汰瘫，是目前使用范圍最廣泛的編碼方案。

大致了解完了字符編碼的歷史問題擂煞，下面就來解決實際的亂碼問題混弥。

經(jīng)常遇到亂碼的場景

如果你像我一樣以Linux作為主用的工作環(huán)境，那么在處理Windows下傳過來的文件時对省，一般都是文本文件蝗拿，肯定會經(jīng)常遇到中文亂碼的情況。

你在Linux下編輯的中文蒿涎，保存為文件傳到Windows下哀托，對方打開也是亂碼。

其實這都是因為不同的系統(tǒng)下默認(rèn)字符編碼不一致造成的劳秋，只需一條命令就能輕松搞定中文亂碼仓手。

在Linux中查看文件編碼方式

1 在Vim中查看文件編碼

用vim打開Windows傳過來的文本文件，輸入
:set fileencoding
返回結(jié)果：
fileencoding=latin1

這里Vim默認(rèn)用latin1編碼來識別文本字符玻淑，所以中文當(dāng)然不能被latin1識別嗽冒。

2 用enca命令識別文件編碼

用法：
$ enca filename
返回結(jié)果：
Simplified Chinese National Standard; GB2312
CRLF line terminators

enca能正確識別出GB2312編碼，不過enca對某些GBK編碼的文件識別的不是很好补履。

編碼轉(zhuǎn)換的幾個方式

1 enconv 命令轉(zhuǎn)換文件編碼

例如添坊，將一個GBK編碼的文件轉(zhuǎn)換成UTF-8編碼：
enconv -L zh_CN -x UTF-8  inputfile
-L 表示從...編碼
-x 表示轉(zhuǎn)換到...編碼

2 iconv 命令轉(zhuǎn)換文件編碼

例如，將一個UTF-8編碼的文件轉(zhuǎn)換成GBK編碼：
iconv -f GBK -t UTF-8 inputfile > outputfile
-f 表示從...編碼
-t 表示轉(zhuǎn)換到...編碼

iconv支持的編碼類型比較多箫锤，我測試了一下iconv正反轉(zhuǎn)換都沒問題贬蛙，但是enconv從utf-8轉(zhuǎn)回GBK沒有成功雨女。一般建議用iconv來做編碼轉(zhuǎn)換，缺點是需要重定向到輸出文件阳准。

====iconv在手氛堕，亂碼不愁====

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市溺职，隨后出現(xiàn)的幾起案子岔擂，更是在濱河造成了極大的恐慌，老刑警劉巖浪耘，帶你破解...
沈念sama閱讀 218,451評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異塑崖，居然都是意外死亡七冲，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,172評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門规婆，熙熙樓的掌柜王于貴愁眉苦臉地迎上來澜躺，“玉大人，你說我怎么就攤上這事抒蚜【虮桑” “怎么了？”我有些...
開封第一講書人閱讀 164,782評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵嗡髓，是天一觀的道長操漠。經(jīng)常有香客問我，道長饿这，這世上最難降的妖魔是什么浊伙？我笑而不...
開封第一講書人閱讀 58,709評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮长捧，結(jié)果婚禮上嚣鄙，老公的妹妹穿的比我還像新娘。我一直安慰自己串结，他們只是感情好哑子，可當(dāng)我...
茶點故事閱讀 67,733評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著肌割，像睡著了一般卧蜓。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上声功，一...
開封第一講書人閱讀 51,578評論 1贊 305
城市分裂傳說
那天烦却，我揣著相機與錄音，去河邊找鬼先巴。笑死其爵，一個胖子當(dāng)著我的面吹牛冒冬，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播摩渺，決...
沈念sama閱讀 40,320評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼简烤，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了摇幻？” 一聲冷哼從身側(cè)響起横侦，我...
開封第一講書人閱讀 39,241評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎绰姻，沒想到半個月后枉侧，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,686評論 1贊 314
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡狂芋，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,878評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年榨馁，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片帜矾。...
茶點故事閱讀 39,992評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡翼虫，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出屡萤，到底是詐尸還是另有隱情珍剑，我是刑警寧澤，帶...
沈念sama閱讀 35,715評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布死陆，位于F島的核電站招拙，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏翔曲。R本人自食惡果不足惜迫像，卻給世界環(huán)境...
茶點故事閱讀 41,336評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望瞳遍。院中可真熱鬧闻妓，春花似錦、人聲如沸掠械。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,912評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽猾蒂。三九已至均唉，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間肚菠，已是汗流浹背舔箭。一陣腳步聲響...
開封第一講書人閱讀 33,040評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人层扶。一個月前我還...
沈念sama閱讀 48,173評論 3贊 370
代替公主和親
正文我出身青樓箫章，卻偏偏與公主長得像，于是被迫代替她去往敵國和親镜会。傳聞我的和親對象是個殘疾皇子檬寂，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,947評論 2贊 355