文本
- 純文本:只能保存單一的內(nèi)容,無(wú)法保存與內(nèi)容無(wú)關(guān)的東西(字體、顏色葛虐、圖片...)
純文本在計(jì)算機(jī)底層也會(huì)轉(zhuǎn)化為位二進(jìn)制保存
- 編碼:將字符轉(zhuǎn)換為二進(jìn)制碼
- 解碼:將二進(jìn)制碼轉(zhuǎn)換為字符
編碼和解碼時(shí)采用的規(guī)則成為字符集
常見(jiàn)的字符集:
ASCII
: 美國(guó)人常用編碼矾柜,使用7位來(lái)對(duì)美國(guó)常用的字符進(jìn)行編碼,包含128個(gè)字符
ISO-8859-1
:歐洲的編碼拘泞,使用8位,包含256個(gè)字符
GB2312
GBK
:國(guó)標(biāo)碼枕扫,中國(guó)的編碼
Unicode
:萬(wàn)國(guó)碼陪腌,包含世界上所有的語(yǔ)言和符號(hào),編寫(xiě)程序時(shí)一般都會(huì)使用Unicode編碼烟瞧,Unicode編碼有多種實(shí)現(xiàn)诗鸭,UTF-8(1-5個(gè)字節(jié)) UTF-16(2-4) UTF-32(4)最常用的就是UTF-8亂碼:檢查字符集是否正確
- 富文本:可以保存文本以外的內(nèi)容(Word文檔)