【QT】QT中文亂碼

以下是dbzhang關(guān)于qt中文亂碼問題原因的闡述潭陪，覺得不錯：

首先呢，聲明一下最蕾，QString 是不存在中文支持問題的依溯，很多人遇到問題，并不是本身 QString 的問題瘟则，而是沒有將自己希望的字符串正確賦給QString黎炉。

很簡單的問題，"我是中文"這樣寫的時候醋拧，它是傳統(tǒng)的 char 類型的窄字符串慷嗜，我們需要的只不過是通過某種方式告訴QString 這四個漢字采用的那種編碼。而問題一般都出在很多用戶對自己當(dāng)前的編碼沒太多概念丹壕，

于是

一個簡單的 Qt 程序

下面這個小程序庆械，估計大家會感到比較親切。似乎有相當(dāng)多的中文用戶嘗試寫過這樣的代碼：

#include #include intmain(intargc,char**argv){QApplicationapp(argc,argv);QStringa="我是漢字";QLabellabel(a);label.show();returnapp.exec();}

編碼菌赖，保存缭乘，編譯，運行琉用，一切都很順利忿峻，可是結(jié)果呢：

多數(shù)用戶看到

其他用戶看到

?òê?oo×?

??‘??ˉ?±‰? —

出乎意料，界面上中文沒顯示出來辕羽，出現(xiàn)了不認(rèn)識字符。于是開始用搜索引擎搜索垄惧，開始上論壇發(fā)帖或抱怨

最后被告知刁愿，下面的語句之一可以解決問題：

QTextCodec::setCodecForCStrings(QTextCodec::codecForName("GB2312"));

QTextCodec::setCodecForCStrings(QTextCodec::codecForName("UTF-8"));

兩條指令挨個一試，確實可以解決(多數(shù)用戶是第一條到逊，其他用戶是第二條)铣口。那么滤钱，為什么會這樣呢？

兩種亂碼什么時候出現(xiàn)

對這個問題脑题，我想大家可能都有話說件缸。在繼續(xù)之前，我們先列個表叔遂，看看兩種亂碼分別在那種情況下出現(xiàn)：

我們只列舉大家最常用的3個編譯器(微軟VS的中的cl他炊，Mingw中的g++，Linux下的g++)已艰，源代碼分別采用GBK和不帶BOM的UTF-8以及帶BOM的UTF-8這3中編碼進行保存痊末。

源代碼的編碼

編譯器

結(jié)果

GBK

mingw-g++

g++

UTF-8(不帶BOM)

mingw-g++

g++

UTF-8(帶BOM)

mingw-g++

g++

編譯失敗

采用3種不同編碼保存的源代碼文件，分別用3種不同的編譯器編譯哩掺，形成9種組合凿叠，除掉一種不能工作的情況，兩種亂碼出現(xiàn)的情況各占一半嚼吞。

從中我們也可以看出盒件，亂碼和操作系統(tǒng)原本是沒有關(guān)系的。但我們在 Windows 一般用的GBK舱禽，linux一般用的是不帶BOM的UTF-8炒刁。如果我們只考慮帶*的情況，也可以說兩種亂碼和系統(tǒng)有關(guān)呢蔫。

QString 為什么會亂碼呢

真的是 QString 亂碼了嗎切心？我們可以問問自己，我們抱怨的對象是不是搞錯了片吊？

繼續(xù)之前绽昏，先明確幾個概念：

明確概念0：

"我是漢字" 是C語言中的字符串，它是char型的窄字符串俏脊。上面的例子可寫為

const char * str = "我是漢字";

QString a= str;

或

char str[] = "我是漢字";

QString a= str;

等

明確概念1：

源文件是有編碼的全谤，但是這種純文本文件卻不會記錄自己采用的編碼

這個是問題的根源，不妨做個試驗爷贫，將前面的源代碼保存成GBK編碼认然，用16進制編輯器能看到引號內(nèi)是ce d2 ca c7 ba ba d7 d6這樣8個字節(jié)。

現(xiàn)在將該文件拷貝到正體(繁體)中文的Windows中漫萄，用記事本打開會什么樣子呢卷员？

...QStringa="扂岆犖趼";QLabellabel(a);label.show();...

那么放到歐美人的Windows系統(tǒng)中，再用記事本打開呢腾务？

...QStringa="?òê?oo×?";QLabellabel(a);label.show();...

同一個文件毕骡，未做任何修改，但其中的8個字節(jié)ce d2 ca c7 ba ba d7 d6,對用GBK的大陸人，用BIG5的港澳臺同胞未巫，以及用Latin-1的歐洲人看來窿撬，看到的卻是完全不同的文字。

明確概念2：

如同我們都了解的'A'與'\x41'等價一樣叙凡。

GBK編碼下的

const char * str = "我是漢字"

等價于

const char * str = "\xce\xd2\xca\xc7\xba\xba\xd7\xd6";

當(dāng)用UTF-8編碼時劈伴，等價于

const char * str = "\xe6\x88\x91\xe6\x98\xaf\xe6\xb1\x89\xe5\xad\x97";

注意：這個說法不全對，比如保存成帶BOM的UTF-8握爷，用cl編譯器時跛璧，漢字本身是UTF-8編碼，但程序內(nèi)保存時卻是對應(yīng)的GBK編碼饼拍。

明確概念3：

QString 內(nèi)部采用的是Unicode赡模。

QString內(nèi)部采用的是 Unicode，它可以同時存放GBK中的字符"我是漢字",BIG5中的字符"扂岆犖趼" 以及Latin-1中的字符"?òê?oo×?"师抄。

一個問題是漓柑，源代碼中的這8個字節(jié)"\xce\xd2\xca\xc7\xba\xba\xd7\xd6"，該怎么轉(zhuǎn)換成Unicode并存到 QString 內(nèi)叨吮？按照GBK辆布、BIG5、Latin-1還是其他方式...

在你不告訴它的情況下茶鉴，它默認(rèn)選擇了Latin-1锋玲，于是8個字符"?òê?oo×?"的unicode碼被存進了QString中。最終涵叮，8個Latin字符出現(xiàn)在你期盼看到4中文字符的地方惭蹂，所謂的亂碼出現(xiàn)了

QString 工作方式

const char * str = "我是漢字";

QString a= str;

其實很簡單的一個問題，當(dāng)你需要從窄字符串 char* 轉(zhuǎn)成Unicode的QString字符串的割粮，你需要告訴QString你的這串char* 中究竟是什么編碼盾碗？GBK、BIG5舀瓢、Latin-1

理想情況就是：將char* 傳給QString時廷雅，同時告訴QString自己的編碼是什么：

就像下面的函數(shù)一樣，QString的成員函數(shù)知道按照何種編碼來處理 C 字符串

QString QString::fromAscii ( const char * str, int size = -1 )

QString QString::fromLatin1 ( const char * str, int size = -1 )

QString QString::fromLocal8Bit ( const char * str, int size = -1 )

QString QString::fromUtf8 ( const char * str, int size = -1 )

單QString 只提供了這幾個成員函數(shù)京髓，遠遠滿足不了大家的需求航缀，比如，在簡體中文Windows下堰怨，local8Bit是GBK芥玉，可是有一個char串是 BIG5 或 Latin-2怎么辦？

那就動用強大的QTextCodec吧备图，首先QTextCodec肯定知道自己所負責(zé)的編碼的飞傀，然后你把一個char串送給它皇型，它就能正確將其轉(zhuǎn)成Unicode了。

QString QTextCodec::toUnicode ( const char * chars ) const

可是這個調(diào)用太麻煩了砸烦，我就想直接

QString a= str;

或

QString a(str);

這樣用怎么辦幻馁？

這樣一來肯定沒辦法同時告訴 QString 你的str是何種編碼了雳灵，只能通過其他方式了。這也就是開頭提到的

QTextCodec::setCodecForCStrings(QTextCodec::codecForName("GBK"));

QTextCodec::setCodecForCStrings(QTextCodec::codecForName("UTF-8"));

設(shè)置QString默認(rèn)采用的編碼皆看。而究竟采用哪一個家破，一般來說就是源代碼是GBK颜说，就用GBK，源代碼是UTF-8就用UTF-8汰聋。但有一個例外门粪，如果你保存成了帶BOM的UTF-8而且用的微軟的cl編譯器，此時仍是GBK烹困。

總結(jié)下玄妈，亂碼出現(xiàn)的原因主要是：

QString內(nèi)部采用的是 Unicode，它可以同時存放GBK中的字符"我是漢字",BIG5中的字符"扂岆犖趼" 以及Latin-1中的字符"?òê?oo×?"髓梅。

當(dāng)你需要從窄字符串 char* 轉(zhuǎn)成Unicode的QString字符串的拟蜻，你需要告訴QString你的這串char* 中究竟是什么編碼？GBK枯饿、BIG5酝锅、Latin-1？

在你不告訴它的情況下奢方，它默認(rèn)選擇了Latin-1搔扁，于是8個字符"?òê?oo×?"的unicode碼被存進了QString中。最終蟋字，8個Latin字符出現(xiàn)在你期盼看到4中文字符的地方稿蹲，

所謂的亂碼出現(xiàn)了。

網(wǎng)上有很多方法介紹直接在main.cpp里設(shè)置：

QTextCodec *codec = QTextCodec::codecForName("UTF-8");

QTextCodec::setCodecForTr(codec);

QTextCodec::setCodecForLocale(codec);

QTextCodec::setCodecForCStrings(codec);

其實這在某些情況下也是有問題的愉老，因為程序可能讀到系統(tǒng)的中文路徑场绿，或者調(diào)用中文路徑下的外部程序，這時候如果系統(tǒng)是gb2312就有問題了嫉入。

因為中文路徑的編碼是采用utf-8存到QString里的焰盗，系統(tǒng)讀中文路徑解碼的時候采用的卻是系統(tǒng)的gb2312，所以會調(diào)不起帶中文路徑的外部程序咒林。

以上問題下面方法可以解決：

QTextCodec *codec = QTextCodec::codecForName("UTF-8");

QTextCodec::setCodecForTr(codec);

QTextCodec::setCodecForLocale(QTextCodec::codecForLocale());

QTextCodec::setCodecForCStrings(QTextCodec::codecForLocale());

對于外部字符串編碼解碼全部采用本地編碼熬拒。

最后編輯于：2017.12.06 04:46:56

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市垫竞，隨后出現(xiàn)的幾起案子澎粟，更是在濱河造成了極大的恐慌蛀序，老刑警劉巖，帶你破解...
沈念sama閱讀 218,036評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件活烙，死亡現(xiàn)場離奇詭異徐裸，居然都是意外死亡，警方通過查閱死者的電腦和手機啸盏，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,046評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門重贺，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人回懦，你說我怎么就攤上這事气笙。” “怎么了怯晕？”我有些...
開封第一講書人閱讀 164,411評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵潜圃，是天一觀的道長。經(jīng)常有香客問我舟茶，道長谭期，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,622評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任稚晚，我火速辦了婚禮崇堵，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘客燕。我一直安慰自己鸳劳，他們只是感情好，可當(dāng)我...
茶點故事閱讀 67,661評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布也搓。她就那樣靜靜地躺著赏廓，像睡著了一般。火紅的嫁衣襯著肌膚如雪傍妒。梳的紋絲不亂的頭發(fā)上幔摸，一...
開封第一講書人閱讀 51,521評論 1贊 304
城市分裂傳說
那天，我揣著相機與錄音颤练，去河邊找鬼既忆。笑死，一個胖子當(dāng)著我的面吹牛嗦玖，可吹牛的內(nèi)容都是我干的患雇。我是一名探鬼主播，決...
沈念sama閱讀 40,288評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼宇挫，長吁一口氣：“原來是場噩夢啊……” “哼苛吱！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起器瘪，我...
開封第一講書人閱讀 39,200評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤翠储，失蹤者是張志新（化名）和其女友劉穎绘雁，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體援所，經(jīng)...
沈念sama閱讀 45,644評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡庐舟，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,837評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了任斋。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片继阻。...
茶點故事閱讀 39,953評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖废酷，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情抹缕，我是刑警寧澤澈蟆，帶...
沈念sama閱讀 35,673評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站卓研，受9級特大地震影響趴俘，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜奏赘，卻給世界環(huán)境...
茶點故事閱讀 41,281評論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一寥闪、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧磨淌，春花似錦疲憋、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,889評論 0贊 22
一樁弒父案缚柳，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至搪锣，卻和暖如春秋忙，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背构舟。一陣腳步聲響...
開封第一講書人閱讀 33,011評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工灰追，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人狗超。一個月前我還...
沈念sama閱讀 48,119評論 3贊 370
代替公主和親
正文我出身青樓弹澎，卻偏偏與公主長得像，于是被迫代替她去往敵國和親抡谐。傳聞我的和親對象是個殘疾皇子裁奇，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,901評論 2贊 355

【QT】QT中文亂碼

推薦閱讀更多精彩內(nèi)容