常見字符編碼格式

介紹幾種常見的編碼

中文編碼

1.GB2321:簡體中文編碼顶捷,一個漢字占用2個字節(jié),在大陸是主要編碼方式屎篱。當文章/網(wǎng)頁中包含繁體中文服赎、日文、韓文等等時交播,這些內容可能無法被正確編碼重虑。
2.BIG5:繁體中文編碼,主要在臺灣地區(qū)采用秦士。
3.GBK:支持簡體及繁體中文缺厉,但對他國非拉丁字母語言還是有問題。
4.UTF-8:Unicode編碼的一種隧土。Unicode用一些基本的保留字符制定了三套編碼方式提针,它們分別UTF-8,UTF-16和UTF-32。在UTF-8中曹傀,字符是以8位序列來編碼的辐脖,用一個或幾個字節(jié)來表示一個字符。這種方式的最大好處皆愉,是UTF-8保留了ASCII字符的編碼做為它的一部分嗜价。UTF-8俗稱“萬國碼”,可以同屏顯示多語種幕庐,一個漢字占用3字節(jié)久锥。為了做到國際化,網(wǎng)頁應盡可能采用UTF-8編碼翔脱。
當然奴拦,處理中文時http頭也要改成UTF-8編碼的-----加上<meta http-equiv="Content-Type" content="text/html; charset=utf-8">。

韓文編碼

1.EUC_KR:用來儲存韓國KSX1001字集(舊稱KSC5601)的字符届吁。此規(guī)格由KSX2901(舊稱KS C 5861)定義
KS X 1001字元使用兩個字節(jié)來表示错妖。
“高位字節(jié)”使用0xA1-0xFE
“低位字節(jié)”使用0xA1-0xFE

日文編碼

1.Shift_JIS :是一個日本電腦系統(tǒng)常用的編碼表。它能容納全角及半角拉丁字母疚沐、平假名暂氯、片假名、符號及日語漢字亮蛔。
它被命名為Shift_JIS的原因痴施,是它在放置全角字符時,要避開原本在0xA1-0xDF放置的半角假名字符。
在微軟及IBM的日語電腦系統(tǒng)中辣吃,即使用了這個編碼表动遭。這個編碼表稱為CP932。
2.EUC_JP:用來存儲日本JISx0208以及JISx0212的字集的字符神得,但日文文字較多使用ISO-2022-JP或Shift_JIS的方法來表示厘惦。

俄文編碼

1.KOI8-R:KOI-8系列的斯拉夫文字8位元編碼,供俄語及保加利亞語使用哩簿。

字符集

常用字符集分類
ASCII及其擴展字符集
作用:表語英語及西歐語言宵蕉。
位數(shù):ASCII是用7位表示的,能表示128個字符节榜;其擴展使用8位表示羡玛,表示256個字符。
范圍:ASCII從00到7F宗苍,擴展從00到FF稼稿。

ISO-8859-1字符集
作用:擴展ASCII,表示西歐浓若、希臘語等渺杉。
位數(shù):8位,
范圍:從00到FF挪钓,兼容ASCII字符集是越。

GB2312字符集
作用:國家簡體中文字符集,兼容ASCII碌上。
位數(shù):使用2個字節(jié)表示倚评,能表示7445個符號,包括6763個漢字馏予,幾乎覆蓋所有高頻率漢字天梧。
范圍:高字節(jié)從A1到F7, 低字節(jié)從A1到FE。將高字節(jié)和低字節(jié)分別加上0XA0即可得到編碼霞丧。

BIG5字符集
作用:統(tǒng)一繁體字編碼呢岗。
位數(shù):使用2個字節(jié)表示,表示13053個漢字蛹尝。
范圍:高字節(jié)從A1到F9后豫,低字節(jié)從40到7E,A1到FE突那。

GBK字符集
作用:它是GB2312的擴展挫酿,加入對繁體字的支持,兼容GB2312愕难。
位數(shù):使用2個字節(jié)表示早龟,可表示21886個字符惫霸。
范圍:高字節(jié)從81到FE,低字節(jié)從40到FE葱弟。

GB18030字符集
作用:它解決了中文壹店、日文、朝鮮語等的編碼芝加,兼容GBK茫打。
位數(shù):它采用變字節(jié)表示(1 ASCII,2妖混,4字節(jié))÷盅螅可表示27484個文字制市。
范圍:1字節(jié)從00到7F; 2字節(jié)高字節(jié)從81到FE,低字節(jié)從40到7E和80到FE弊予;4字節(jié)第一三字節(jié)從81到FE祥楣,第二四字節(jié)從30到39。

UCS字符集
作用:國際標準 ISO 10646 定義了通用字符集 (Universal Character Set)汉柒。它是與UNICODE同類的組織误褪,UCS-2和UNICODE兼容。
位數(shù):它有UCS-2和UCS-4兩種格式碾褂,分別是2字節(jié)和4字節(jié)兽间。
范圍:目前,UCS-4只是在UCS-2前面加了0x0000正塌。

UNICODE字符集
作用:為世界650種語言進行統(tǒng)一編碼嘀略,兼容ISO-8859-1。
位數(shù):UNICODE字符集有多個編碼方式乓诽,分別是UTF-8帜羊,UTF-16和UTF-32。

在IOS中的應用

+ (NSData *)encodeDataWithString:(NSString *)string
{
    /**
     kCFStringEncodingGB_18030_2000:簡體中文
     kCFStringEncodingBig5:繁體中文編碼
     kCFStringEncodingEUC_KR:韓文編碼
     kCFStringEncodingShiftJIS:日文編碼
     kCFStringEncodingEUC_JP:日文編碼
     kCFStringEncodingKOI8_R:俄文編碼
     */
    NSData *data = [string dataUsingEncoding:CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingBig5)];
    return data;
}
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末鸠天,一起剝皮案震驚了整個濱河市讼育,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌稠集,老刑警劉巖奶段,帶你破解...
    沈念sama閱讀 218,640評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異巍杈,居然都是意外死亡忧饭,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,254評論 3 395
  • 文/潘曉璐 我一進店門筷畦,熙熙樓的掌柜王于貴愁眉苦臉地迎上來词裤,“玉大人刺洒,你說我怎么就攤上這事『鹕埃” “怎么了逆航?”我有些...
    開封第一講書人閱讀 165,011評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長渔肩。 經(jīng)常有香客問我因俐,道長,這世上最難降的妖魔是什么周偎? 我笑而不...
    開封第一講書人閱讀 58,755評論 1 294
  • 正文 為了忘掉前任抹剩,我火速辦了婚禮,結果婚禮上蓉坎,老公的妹妹穿的比我還像新娘澳眷。我一直安慰自己,他們只是感情好蛉艾,可當我...
    茶點故事閱讀 67,774評論 6 392
  • 文/花漫 我一把揭開白布钳踊。 她就那樣靜靜地躺著,像睡著了一般勿侯。 火紅的嫁衣襯著肌膚如雪拓瞪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,610評論 1 305
  • 那天助琐,我揣著相機與錄音祭埂,去河邊找鬼。 笑死弓柱,一個胖子當著我的面吹牛沟堡,可吹牛的內容都是我干的。 我是一名探鬼主播矢空,決...
    沈念sama閱讀 40,352評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼航罗,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了屁药?” 一聲冷哼從身側響起粥血,我...
    開封第一講書人閱讀 39,257評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎酿箭,沒想到半個月后复亏,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,717評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡缭嫡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,894評論 3 336
  • 正文 我和宋清朗相戀三年缔御,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片妇蛀。...
    茶點故事閱讀 40,021評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡耕突,死狀恐怖笤成,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情眷茁,我是刑警寧澤炕泳,帶...
    沈念sama閱讀 35,735評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站上祈,受9級特大地震影響培遵,放射性物質發(fā)生泄漏。R本人自食惡果不足惜登刺,卻給世界環(huán)境...
    茶點故事閱讀 41,354評論 3 330
  • 文/蒙蒙 一籽腕、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧纸俭,春花似錦节仿、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,936評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽矾瘾。三九已至女轿,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間壕翩,已是汗流浹背蛉迹。 一陣腳步聲響...
    開封第一講書人閱讀 33,054評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留放妈,地道東北人北救。 一個月前我還...
    沈念sama閱讀 48,224評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像芜抒,于是被迫代替她去往敵國和親珍策。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,974評論 2 355

推薦閱讀更多精彩內容

  • 原文在這里:各種字符集和編碼詳解 在軟件的編碼和實現(xiàn)中宅倒,我們可能會碰到個 一個比較頭疼的問題--編碼攘宙,不同字符間的...
    舌尖上的大胖閱讀 1,794評論 0 2
  • 感賞還是舒緩蹭劈,分不清 000 想寫卻分不清楚 窩在家里對著電腦,挺郁悶的线召。 下午兩個姨來了铺韧,帶了好多水果,和我聊了...
    翟美麗閱讀 166評論 1 0
  • 睡不著的人生很容易陷入思考缓淹。貪戀無知哈打,更不如說是欲望塔逃,終究沒得到自己想要的。Everything in this ...
    麾毛桿兒閱讀 533評論 0 0
  • 之前單位的一個老師病了前酿,偶然知道了她病復發(fā)了患雏,今天終于還是趁著休息在沒有提前打電話說的情況下直接沖了過去,找了...
    思非閱讀 260評論 0 0
  • 暑假期間,我經(jīng)常帶日子出去吃飯肺孵。無論到哪家餐廳匀借,我總是會點上有關香椿的菜。兒子就說平窘,老爸吓肋,就算你要我憶苦思甜,也不...
    微言微評閱讀 390評論 0 0