UTF-8 UTF-16 UTF-32 比較

優(yōu)點(diǎn)

UTF-8

兼容 ASCII
能適應(yīng)許多 C 庫中的 \0 結(jié)尾慣例
沒有字節(jié)序問題
良好的多語種支持（相對(duì) GBK 等跟語種綁定的編碼方式）
以英文和西文符號(hào)比較多的場(chǎng)景下（例如 HTML/XML）烹吵，編碼較短
由于是變長(zhǎng)，字符空間足夠大，未來 Unicode 新標(biāo)準(zhǔn)收錄更多字符，UTF-8 也能妥妥的兼容喇潘，因此不會(huì)再出現(xiàn) UTF-16 那樣的尷尬
不存在大小端字節(jié)序問題戒劫，信息交換時(shí)非常便捷
容錯(cuò)性高，局部的字節(jié)錯(cuò)誤（丟失耘沼、增加韧衣、改變）不會(huì)導(dǎo)致連鎖性的錯(cuò)誤盅藻，因?yàn)?UTF-8 的字符邊界很容易檢測(cè)出來购桑，這是一個(gè)巨大的優(yōu)點(diǎn)（正是為了實(shí)現(xiàn)這一點(diǎn)，咱們中日韓人民不得不忍受 3 字節(jié) 1 個(gè)字符的苦日子）

UTF-16（應(yīng)該不算優(yōu)點(diǎn)）

最流行的操作系統(tǒng)和 UI framework 的內(nèi)部字符串表達(dá)都是 UTF-16

Windows API 的 Wide Char 表達(dá)是 UTF-16: Unicode (Windows), L"" 表示是轉(zhuǎn)換為 wide char氏淑。

Cocoa 的 NSString 和 Core Foundation 的 CFString 內(nèi)部表達(dá)都是 UTF-16其兴，所以其實(shí) OS X 和 iOS 內(nèi)部處理都用的是 UTF-16。

Java String 的內(nèi)部表達(dá)是 UTF-16夸政，所以大量跨平臺(tái)程序和 Android 程序其實(shí)內(nèi)部也在用 UTF-16。

在計(jì)算字符串長(zhǎng)度榴徐、執(zhí)行索引操作時(shí)速度很快守问。

注：但是UTF-16也是變長(zhǎng)的，Unicode擴(kuò)展到9萬多以后坑资，也要通過變長(zhǎng)來支持了耗帕。
具體原因參照知乎回答：
編程語言的字符編碼選擇UTF-8和UTF-16的優(yōu)缺點(diǎn)？

UTF-32

定長(zhǎng)編碼袱贮，utf32 表示任何字符都用 4 字節(jié)仿便，讀到內(nèi)存中是個(gè)均勻的整形數(shù)組，于是我們可以很方便地隨機(jī)訪問任何一個(gè)字符
由于是定長(zhǎng)攒巍，索引比變長(zhǎng)的要快嗽仪，你想訪問一個(gè)字符串中的第 n 個(gè)字符，utf32 直接偏移 n 個(gè)整形距離即可柒莉，utf8 得從第一個(gè)字節(jié)一個(gè)字一個(gè)字地往后蹦闻坚，非常蛋疼。

補(bǔ)充：
UTF 32 也不想理想中那么方便索引兢孝，主要是 emoji 的鍋窿凤，舉兩個(gè)例子：一、Emoji 里面的國旗其實(shí)由兩個(gè)字符組成跨蟹，稱為 region indicator雳殊，每個(gè)字符是一個(gè) region indicator symbol letter，從 A 到 Z窗轩，U+1F1E6 到 U+1F1FF夯秃。比如說法國國旗就是用 FR 的對(duì)應(yīng) region indicator symbol letter 來表示的。Swift 的 String 自稱有較好的 Unicode 支持痢艺，但對(duì)這樣的字符的長(zhǎng)度目前給的還是 2（Unicode 8.0 標(biāo)準(zhǔn)）寝并，而實(shí)際上 Unicode 9.0 已經(jīng)要求把它們看作一個(gè)字符了。二腹备、為了政治正確衬潦，人們引入了帶膚色的 emoji 表情，它們是由普通表情和一個(gè)代表顏色的 emoji 字符組成植酥。于是乎镀岛，如果寫編輯器的話弦牡，不管怎么樣都要 O(n) 來計(jì)算可見字符的長(zhǎng)度的（這還沒有考慮韓語那種三個(gè)字符疊成一個(gè)字符的情況），所以前端們很可憐的漂羊。
參見劉閩晟回答驾锰，鏈接

缺點(diǎn)

UTF-8

文化上的不平衡——對(duì)于歐美地區(qū)一些以英語為母語的國家 UTF-8 簡(jiǎn)直是太棒了，因?yàn)樗?ASCII 一樣走越，一個(gè)字符只占一個(gè)字節(jié)椭豫，沒有任何額外的存儲(chǔ)負(fù)擔(dān)；但是對(duì)于中日韓等國家來說旨指，UTF-8 實(shí)在是太冗余赏酥，一個(gè)字符竟然要占用 3 個(gè)字節(jié)，存儲(chǔ)和傳輸?shù)男什坏珱]有提升谆构，反而下降了裸扶。所以歐美人民常常毫不猶豫的采用 UTF-8，而我們卻老是要猶豫一會(huì)兒搬素。
變長(zhǎng)字節(jié)表示帶來的效率問題——大家對(duì) UTF-8 疑慮重重的一個(gè)問題就是在于其因?yàn)槭亲冮L(zhǎng)字節(jié)表示呵晨，因此無論是計(jì)算字符數(shù)，還是執(zhí)行索引操作效率都不高熬尺。為了解決這個(gè)問題摸屠，常常會(huì)考慮把 UTF-8 先轉(zhuǎn)換為 UTF-16 或者 UTF-32 后再操作，操作完畢后再轉(zhuǎn)換回去粱哼。而這顯然是一種性能負(fù)擔(dān)餐塘。

UTF-16

UTF-16 能表示的字符數(shù)有 6 萬多，看起來很多皂吮，但是實(shí)際上目前 Unicode 5.0 收錄的字符已經(jīng)達(dá)到 99024 個(gè)字符戒傻，早已超過 UTF-16 的存儲(chǔ)范圍；這直接導(dǎo)致 UTF-16 地位頗為尷尬——如果誰還在想著只要使用 UTF-16 就可以高枕無憂的話蜂筹，恐怕要失望了需纳。
UTF-16 存在大小端字節(jié)序問題，這個(gè)問題在進(jìn)行信息交換時(shí)特別突出——如果字節(jié)序未協(xié)商好艺挪，將導(dǎo)致亂碼不翩；如果協(xié)商好，但是雙方一個(gè)采用大端一個(gè)采用小端麻裳，則必然有一方要進(jìn)行大小端轉(zhuǎn)換口蝠，性能損失不可避免（大小端問題其實(shí)不像看起來那么簡(jiǎn)單，有時(shí)會(huì)涉及硬件津坑、操作系統(tǒng)妙蔗、上層軟件多個(gè)層次，可能會(huì)進(jìn)行多次轉(zhuǎn)換）疆瑰。
另外眉反，容錯(cuò)性低有時(shí)候也是一大問題——局部的字節(jié)錯(cuò)誤昙啄，特別是丟失或增加可能導(dǎo)致所有后續(xù)字符全部錯(cuò)亂，錯(cuò)亂后要想恢復(fù)寸五，可能很簡(jiǎn)單梳凛，也可能會(huì)非常困難。（這一點(diǎn)在日常生活里大家感覺似乎無關(guān)緊要梳杏，但是在很多特殊環(huán)境下卻是巨大的缺陷）韧拒。

該如何選擇

簡(jiǎn)要回答：
UTF-8，用于存儲(chǔ)及傳輸
UTF-32十性，用于程序內(nèi)存中

原因：

UTF-8靈活叛溢，在互聯(lián)網(wǎng)通信中被編碼影響小，兼容性強(qiáng)烁试。

UTF-32定長(zhǎng)，在內(nèi)存中程序處理優(yōu)秀拢肆，查詢快减响。

因?yàn)闊o論是 UTF-8 和 UTF-16/32 都各有優(yōu)缺點(diǎn)，因此選擇的時(shí)候應(yīng)當(dāng)立足于實(shí)際的應(yīng)用場(chǎng)景郭怪。例如在我的習(xí)慣中支示，存儲(chǔ)在磁盤上或進(jìn)行網(wǎng)絡(luò)交換時(shí)都會(huì)采用 UTF-8，而在程序內(nèi)部進(jìn)行處理時(shí)則轉(zhuǎn)換為 UTF-16/32鄙才。對(duì)于大多數(shù)簡(jiǎn)單的程序來說颂鸿，這樣做既可以保證信息交換時(shí)容易實(shí)現(xiàn)相互兼容，同時(shí)在內(nèi)部處理時(shí)會(huì)比較簡(jiǎn)單攒庵，性能也還算不錯(cuò)嘴纺。（基本上只要你的程序不是 I/O 密集型的都可以這么干，當(dāng)然這只是我粗淺的認(rèn)識(shí)范圍內(nèi)的經(jīng)驗(yàn)浓冒，很可能會(huì)被無情的反駁）栽渴。

整理自：
知乎 - 為什么 UTF-8 編碼比 UTF-16 編碼應(yīng)用更廣泛？
參與回答：
林建入- 回答

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末稳懒，一起剝皮案震驚了整個(gè)濱河市闲擦，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌场梆，老刑警劉巖墅冷，帶你破解...
沈念sama閱讀 217,657評(píng)論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異或油，居然都是意外死亡寞忿，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,889評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門顶岸，熙熙樓的掌柜王于貴愁眉苦臉地迎上來罐脊，“玉大人定嗓，你說我怎么就攤上這事∑甲溃” “怎么了宵溅？”我有些...
開封第一講書人閱讀 164,057評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)上炎。經(jīng)常有香客問我恃逻，道長(zhǎng)，這世上最難降的妖魔是什么藕施？我笑而不...
開封第一講書人閱讀 58,509評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任寇损，我火速辦了婚禮，結(jié)果婚禮上裳食，老公的妹妹穿的比我還像新娘矛市。我一直安慰自己，他們只是感情好诲祸，可當(dāng)我...
茶點(diǎn)故事閱讀 67,562評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布浊吏。她就那樣靜靜地躺著，像睡著了一般救氯。火紅的嫁衣襯著肌膚如雪找田。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,443評(píng)論 1贊 302
城市分裂傳說
那天着憨，我揣著相機(jī)與錄音墩衙，去河邊找鬼。笑死甲抖，一個(gè)胖子當(dāng)著我的面吹牛漆改，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播准谚，決...
沈念sama閱讀 40,251評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼籽懦，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了氛魁？” 一聲冷哼從身側(cè)響起暮顺，我...
開封第一講書人閱讀 39,129評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎秀存，沒想到半個(gè)月后捶码，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,561評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡或链，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,779評(píng)論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年惫恼，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片澳盐。...
茶點(diǎn)故事閱讀 39,902評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡祈纯，死狀恐怖令宿，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情腕窥，我是刑警寧澤粒没，帶...
沈念sama閱讀 35,621評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站簇爆，受9級(jí)特大地震影響癞松，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜入蛆，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,220評(píng)論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一响蓉、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧哨毁，春花似錦枫甲、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,838評(píng)論 0贊 22
一樁弒父案想幻，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至迎捺，卻和暖如春举畸，著一層夾襖步出監(jiān)牢的瞬間查排，已是汗流浹背凳枝。一陣腳步聲響...
開封第一講書人閱讀 32,971評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留跋核，地道東北人岖瑰。一個(gè)月前我還...
沈念sama閱讀 48,025評(píng)論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像砂代，于是被迫代替她去往敵國和親蹋订。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,843評(píng)論 2贊 354

UTF-8 UTF-16 UTF-32 比較

優(yōu)點(diǎn)

UTF-8

UTF-16（應(yīng)該不算優(yōu)點(diǎn)）

UTF-32

缺點(diǎn)

UTF-8

UTF-16

該如何選擇

推薦閱讀更多精彩內(nèi)容