使用Navicate圖形化界面工具
字符集
字符集的由來(lái)
? 計(jì)算機(jī)只能識(shí)別二進(jìn)制代碼無(wú)論是計(jì)算機(jī)程序還是數(shù)據(jù)掺炭,最終都會(huì)轉(zhuǎn)換成二進(jìn)制秒梳,計(jì)算機(jī)才能認(rèn)識(shí)法绵。
? 為了計(jì)算機(jī)不只能做科學(xué)計(jì)算,也能處理文字信息酪碘。
人們想出了給每一個(gè)文字符號(hào)編碼以便于計(jì)算識(shí)別處理的辦法朋譬,這就是計(jì)算機(jī)字符集的由來(lái)。
ASSCII
? 一套文字符號(hào)及其編碼,比較規(guī)則 的集合兴垦。
? 20世紀(jì)60年代初徙赢。美國(guó)標(biāo)準(zhǔn)化組織ANSI發(fā)布了第一個(gè)字符集字柠。ASCII
? 后來(lái)又進(jìn)一步變成了國(guó)際標(biāo)準(zhǔn)ISO-646
? 各大字符集
? 自ASCII后。為了處理不同的文字狡赐。各大計(jì)算機(jī)公司窑业,各國(guó),標(biāo)準(zhǔn)化政府枕屉,組織先后發(fā)明了幾百種字符集常柄。
? ISO-8859
? GB2312-80
? GBK
? BIG5
? 這些五花八門(mén)的字符集從收錄的字符集到編碼規(guī)則各不相同。給計(jì)算機(jī)軟件開(kāi)發(fā)和移值帶來(lái)了很大的困難搀擂。一個(gè)軟件要在使用不同文字的國(guó)家和地區(qū)發(fā)布西潘,必須得要做本地化開(kāi)發(fā)。
? 基于這個(gè)原因哨颂,要統(tǒng)一字符編碼喷市。
unicode
? 為了統(tǒng)一字符編碼。國(guó)際標(biāo)準(zhǔn)化組織ISO的一些成員國(guó)于1984年發(fā)起制定了新的國(guó)際字符集標(biāo)準(zhǔn)威恼。容納全世界各種語(yǔ)言品姓,文字,和 符號(hào)箫措。最后這個(gè)標(biāo)準(zhǔn)ISO-10646
? ISO-10646發(fā)布后腹备,遭到了美國(guó)計(jì)算機(jī)公司的反對(duì)。
? 1988年蒂破,Xerox公司提議制定了新的以16位編碼人統(tǒng)一字符集馏谨。并聯(lián)合不Apple,IBM,SUN,Microsoft等公司成立了Unicode技術(shù)委員會(huì)附迷。專(zhuān)門(mén)負(fù)責(zé)收集惧互,整理,和編碼喇伯。于1991年推出了Unicode1.0
? 都是為了字符編碼統(tǒng)一問(wèn)題喊儡,ISO和Unicode協(xié)會(huì)推出了連個(gè)不同人標(biāo)準(zhǔn)。這顯然是不利的稻据。后來(lái)雙方開(kāi)始談判艾猜。1991年10月達(dá)成協(xié)議。ISO將Unicode收編捻悯。起了個(gè)名BMP
UTF-16
? ISO-10646編碼空間足以容納從古自今使用過(guò)的文字和字符匆赃。但很多文字字符已經(jīng)很少用了。
? 超過(guò)99%的在用文字字符都編入了BMP.因此今缚,絕大部分情況下算柳。
? Unicode雙字節(jié)方式都能滿(mǎn)足需求。而且比雙字節(jié)編碼方式4字節(jié)原始編碼來(lái)說(shuō)姓言,更節(jié)省內(nèi)存和處理時(shí)間 瞬项。這也是Unicode流行的原因蔗蹋。
? 萬(wàn)一使用了BMP以這后文字怎么辦?
? Unicode提出了UTF-16的解決辦法囱淋。
UTF-8
? 雖然UTF-16解決了上面問(wèn)題猪杭。但當(dāng)時(shí)的計(jì)算機(jī)和網(wǎng)絡(luò)世界還是ASCII的天下。只能處理單字節(jié)數(shù)據(jù)流妥衣。UTF-16離開(kāi)了Unicode環(huán)境后皂吮。在傳輸和處理中,都存在問(wèn)題称鳞。
? 于是又提出了UTF-8的解決文案涮较,
? UTF-8按一定的規(guī)則,將一個(gè)ISO10646或Unicode轉(zhuǎn)換成1至4個(gè)字節(jié)的編碼
? 其中ASCII轉(zhuǎn)成單字節(jié)編碼冈止。也就嚴(yán)格兼容了ASCII字符集。
? UTF-8的2候齿,3熙暴,4字節(jié)用以轉(zhuǎn)換ISO-10646標(biāo)準(zhǔn)的UCS-4原始碼。
漢字的一些常見(jiàn)字符集
? GB2312
? GB13000
? GBK
? GB18030