手機(jī)開發(fā)實(shí)戰(zhàn)44——手機(jī)字符編碼介紹2

編碼

UTF-8:

采用變長(zhǎng)字節(jié)(1 ASCII, 2希臘字母, 3漢字, 4平面符號(hào))表示陡舅。在網(wǎng)絡(luò)傳輸時(shí),即使錯(cuò)了一個(gè)字節(jié)纵潦,不影響其他字節(jié)偶房,而雙字節(jié)只要一個(gè)錯(cuò)了摆寄,其他也錯(cuò)了失暴,具體如下:

如果只有一個(gè)字節(jié)則其最高二進(jìn)制位為0坯门;如果是多字節(jié),其第一個(gè)字節(jié)從最高位開始逗扒,連續(xù)的二進(jìn)制位值為1的個(gè)數(shù)決定了其編碼的字節(jié)數(shù)古戴,其余各字節(jié)均以10開頭。UTF-8最多可用到6個(gè)字節(jié)矩肩。

UTF-16:

采用2字節(jié)现恼,Unicode中不同部分的字符都同樣基于現(xiàn)有的標(biāo)準(zhǔn)。這是為了便于轉(zhuǎn)換黍檩。

從0×0000到0×007F是ASCII字符叉袍,

從0×0080到0×00FF是ISO-8859-1對(duì)ASCII的擴(kuò)展。

希臘字母表使用從0×0370到0×03FF的代碼刽酱,

斯拉夫語(yǔ)使用從0×0400到0×04FF的代碼喳逛,

美國(guó)使用從0×0530到0×058F的代碼,

希伯來語(yǔ)使用從0×0590到0×05FF的代碼棵里。

中國(guó)润文、日本和韓國(guó)的象形文字(總稱為CJK)占用了從0×3000到0×9FFF的代碼;由于0×00在c語(yǔ)言及操作系統(tǒng)文件名等中有特殊意義殿怜,故很多情況下需要UTF-8編碼保存文本典蝌,去掉這個(gè)0×00。舉例如下:

UTF-16: 0×0080 ?= 0000 0000 1000 0000

UTF-8: ? 0xC280 = 1100 0010 1000 0000

UTF-32:采用4字節(jié)头谜。

優(yōu)缺點(diǎn)

UTF-8骏掀、UTF-16和UTF-32都可以表示有效編碼空間(U+000000-U+10FFFF)內(nèi)的所有Unicode字符。

使用UTF-8編碼時(shí)ASCII字符只占1個(gè)字節(jié)乔夯,存儲(chǔ)效率比較高砖织,適用于拉丁字符較多的場(chǎng)合以節(jié)省空間。

對(duì)于大多數(shù)非拉丁字符(如中文和日文)來說末荐,UTF-16所需存儲(chǔ)空間最小,每個(gè)字符只占2個(gè)字節(jié)新锈。

Windows NT內(nèi)核是Unicode(UTF-16)甲脏,采用UTF-16編碼在調(diào)用系統(tǒng)API時(shí)無需轉(zhuǎn)換,處理速度也比較快妹笆。

采用UTF-16和UTF-32會(huì)有Big Endian和Little Endian之分块请,而UTF-8則沒有字節(jié)順序問題,所以UTF-8適合傳輸和通信拳缠。

UTF-32采用4字節(jié)編碼墩新,一方面處理速度比較快,但另一方面也浪費(fèi)了大量空間窟坐,影響傳輸速度海渊,因而很少使用绵疲。

如何判斷字符集

1字節(jié)序

首先說一下字節(jié)序?qū)幋a的影響,字節(jié)序分為Big Endian字節(jié)序和Little Endian字節(jié)序臣疑。不同的處理器可能不一樣盔憨。所以,傳輸時(shí)需要告訴處理器當(dāng)時(shí)的編碼字節(jié)序讯沈。對(duì)于前者而言郁岩,高位字節(jié)存在低地址,低字節(jié)存于高地址缺狠;后者相反问慎。例如,0X03AB,

Big Endian字節(jié)序

0000: 0 3

0001: AB

Little Endian字節(jié)序是

0000: AB

0001: 0 3

2編碼識(shí)別

UNICODE挤茄,根據(jù)前幾個(gè)字節(jié)可以判斷UNICODE字符集的各種編碼蝴乔,叫做Byte Order Mask方法BOM:

UTF-8: EFBBBF (符合UTF-8格式,請(qǐng)看上面驮樊。但沒有含義在UCS即UNICODE中)

UTF-16 Big Endian:FEFF (沒有含義在UCS-2中)

UTF-16 Little Endian:FFFE (沒有含義在UCS-2中)

UTF-32 Big Endian:0000FEFF (沒有含義在UCS-4中)

UTF-32 Little Endian:FFFE0000 (沒有含義在UCS-4中)

GB2312:高字節(jié)和低字節(jié)的第1位都是1薇正。

BIG5,GBK&GB18030:高字節(jié)的第1位為1囚衔。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末挖腰,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子练湿,更是在濱河造成了極大的恐慌猴仑,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,858評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件肥哎,死亡現(xiàn)場(chǎng)離奇詭異辽俗,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)篡诽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門崖飘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人杈女,你說我怎么就攤上這事朱浴。” “怎么了达椰?”我有些...
    開封第一講書人閱讀 165,282評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵翰蠢,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我啰劲,道長(zhǎng)梁沧,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,842評(píng)論 1 295
  • 正文 為了忘掉前任蝇裤,我火速辦了婚禮廷支,結(jié)果婚禮上频鉴,老公的妹妹穿的比我還像新娘。我一直安慰自己酥泞,他們只是感情好砚殿,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,857評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著芝囤,像睡著了一般似炎。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上悯姊,一...
    開封第一講書人閱讀 51,679評(píng)論 1 305
  • 那天羡藐,我揣著相機(jī)與錄音,去河邊找鬼悯许。 笑死仆嗦,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的先壕。 我是一名探鬼主播瘩扼,決...
    沈念sama閱讀 40,406評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼垃僚!你這毒婦竟也來了集绰?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,311評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤谆棺,失蹤者是張志新(化名)和其女友劉穎栽燕,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體改淑,經(jīng)...
    沈念sama閱讀 45,767評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡碍岔,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了朵夏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蔼啦。...
    茶點(diǎn)故事閱讀 40,090評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖侍郭,靈堂內(nèi)的尸體忽然破棺而出询吴,到底是詐尸還是另有隱情,我是刑警寧澤亮元,帶...
    沈念sama閱讀 35,785評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站唠摹,受9級(jí)特大地震影響爆捞,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜勾拉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,420評(píng)論 3 331
  • 文/蒙蒙 一煮甥、第九天 我趴在偏房一處隱蔽的房頂上張望盗温。 院中可真熱鬧,春花似錦成肘、人聲如沸卖局。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)砚偶。三九已至,卻和暖如春洒闸,著一層夾襖步出監(jiān)牢的瞬間染坯,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評(píng)論 1 271
  • 我被黑心中介騙來泰國(guó)打工丘逸, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留单鹿,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,298評(píng)論 3 372
  • 正文 我出身青樓深纲,卻偏偏與公主長(zhǎng)得像仲锄,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子湃鹊,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,033評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 摘要:本文從Unicode入手涛舍,介紹由于通信問題而產(chǎn)生的字符集澄惊,以及Unicode的發(fā)展情況。介紹各種字符集的及其...
    瘋狂的冰塊閱讀 2,000評(píng)論 0 6
  • 文件編碼格式 從文件編碼的方式來看富雅,文件可分為ASCII碼文件和二進(jìn)制碼文件兩種掸驱。 ASCII文件也稱為文本文件,...
    beimingke閱讀 2,838評(píng)論 0 1
  • 我們每個(gè)人都有丟東西的體驗(yàn)吧没佑,可能是焦急毕贼,可能是痛恨,也可能是恐懼蛤奢。 我已經(jīng)很久沒有丟東西了鬼癣,直到...
    安非他命rsww閱讀 336評(píng)論 4 4
  • 到了高中,留起了長(zhǎng)發(fā)啤贩,衣著打扮也偏向韓裝待秃,顯的整體我的顏值水準(zhǔn)呈中上水平,表現(xiàn)的還比較活躍痹屹。 此時(shí)便有姑娘主動(dòng)追求...
    未央行者閱讀 215評(píng)論 0 0
  • 就像做家務(wù)章郁,多做,反復(fù)做志衍,才能熟能生巧暖庄,才能靈活應(yīng)用聊替;而不是剛開始,感覺會(huì)了就不做了培廓。讀書做事惹悄,都如此。
    zhaodongbo閱讀 586評(píng)論 0 0