第一步
如何存儲(chǔ)0和1
每個(gè)內(nèi)存條上的矩陣拜轨,都有類似上圖的東西印颤,里面每個(gè)圓點(diǎn)可以代表 0 和 1 事甜,表示零的時(shí)候就不充電,表示1的時(shí)候就充電佳簸,這樣我們就可以把0和1存放到電腦上了 乙墙。
第二步?
進(jìn)制的轉(zhuǎn)換
我們要把生活中的10進(jìn)制數(shù)轉(zhuǎn)換為電腦能懂得二進(jìn)制數(shù)
第三步
儲(chǔ)存字符
美國人發(fā)明了ASCii表格,用10進(jìn)制數(shù)對(duì)應(yīng)相應(yīng)的字母和符號(hào)生均√耄總共128個(gè)。相當(dāng)于2的7次方马胧,就是說7位就可以表示一個(gè)字母汉买,補(bǔ)齊8位表示一個(gè)字母和符號(hào)(位是電腦里最小的單位,就是圖1里面的一個(gè)小圓)1字節(jié)=8位? 1024字節(jié)=1kb 1024kb=1m
我國在80年代根據(jù)美國的ASCii表格做了擴(kuò)展(因?yàn)橐蜃职?佩脊,難道打拼音嗎ASCii表格只能打數(shù)字和字母)蛙粘,一共收錄了6000多個(gè)漢字垫卤,之前2的8次方就可以把所有ASCII里面的東西做出來,但是現(xiàn)在要存6000多個(gè)字出牧,所以就進(jìn)位穴肘,都是2倍,所以2的16次方崔列,就可以吧GB2312字符集里面的字體都包含了梢褐。就是16個(gè)2進(jìn)制數(shù)旺遮,才能表示漢字赵讯,所以是一個(gè)漢字是兩個(gè)字節(jié)。在后來win95進(jìn)入中國耿眉,微軟出了GBK边翼,擴(kuò)展了GB2312。
當(dāng)有了中文以后鸣剪,有個(gè)組織 unicode 要把全世界的字體都收集起來组底,有將近12w個(gè),原來2的16次方已經(jīng)不夠了筐骇,所以次數(shù)在翻翻 债鸡,2的32次方,也就是說表示一個(gè)unicode的字铛纬,我們需要32位 4個(gè)字節(jié)厌均,這也是unicode最大的缺點(diǎn),所以u(píng)tf-8出現(xiàn)了 告唆,utf-8的作用是 把unicode的字符棺弊,高效的存到電腦里面,其實(shí)也就是做了一些手腳擒悬,讓電腦會(huì)讀模她,看下圖就懂了
當(dāng)時(shí)1個(gè)字節(jié)的時(shí)候,就在前面補(bǔ)個(gè)零懂牧,然后后面的照搬
當(dāng)時(shí)2個(gè)字節(jié)的時(shí)候侈净, 在第一段字節(jié)的權(quán)限加110+(補(bǔ)全) 第二段字節(jié)的前面加10+(補(bǔ)全)
以此類推,看圖就能理解了 僧凤。