摘要:
字符編碼(英語:Character encoding)也稱字集碼,是把字符集中的字符編碼為指定集合中某一對象(例如:比特模式椅邓、自然數(shù)序列柠逞、8位組或者電脈沖),以便文本在計算機中存儲和通過通信網(wǎng)絡(luò)的傳遞景馁。常見的例子包括將拉丁字母表編碼成摩斯電碼和ASCII板壮。其中,ASCII將字母合住、數(shù)字和其它符號編號绰精,并用7比特的二進制來表示這個整數(shù)。通常會額外使用一個擴充的比特透葛,以便于以1個字節(jié)的方式存儲笨使。
在顯示器上看見的文字、圖片等信息在電腦里面其實并不是我們看見的樣子获洲,即使你知道所有信息都存儲在硬盤里阱表,把它拆開也看不見里面有任何東西,只有些盤片贡珊。假設(shè)最爬,你用顯微鏡把盤片放大,會看見盤片表面凹凸不平门岔,凸起的地方被磁化爱致,凹的地方是沒有被磁化;凸起的地方代表數(shù)字1寒随,凹的地方代表數(shù)字0糠悯。硬盤只能用0和1來表示所有文字、圖片等信息妻往。那么字母”A”在硬盤上是如何存儲的呢互艾?可能小張計算機存儲字母”A”是1100001,而小王存儲字母”A”是11000010讯泣,這樣雙方交換信息時就會誤解纫普。比如小張把1100001發(fā)送給小王,小王并不認為1100001是字母”A”好渠,可能認為這是字母”X”昨稼,于是小王在用記事本訪問存儲在硬盤上的1100001時,在屏幕上顯示的就是字母”X”拳锚。也就是說假栓,小張和小王使用了不同的編碼表。小張用的編碼表是ASCII霍掺,ASCII編碼表把26個字母都一一的對應到2進制1和0上匾荆;小王用的編碼表可能是EBCDIC,只不過EBCDIC編碼與ASCII編碼中的字母和01的對應關(guān)系不同拌蜘。一般地說,開放的操作系統(tǒng)(LINUX 棋凳、WINDOWS等)采用ASCII 編碼拦坠,而大型主機系統(tǒng)(MVS 连躏、OS/390等)采用EBCDIC 編碼剩岳。在發(fā)送數(shù)據(jù)給對方前,需要事先告知對方自己所使用的編碼入热,或者通過轉(zhuǎn)碼拍棕,使不同編碼方案的兩個系統(tǒng)可溝通自如。