摘要:
1,位向族,字節(jié)等概念
2捌袜,基本的數(shù)據(jù)類型
3,移位
4炸枣,有符號(hào)數(shù)的處理/補(bǔ)碼
1虏等,一般計(jì)算機(jī)中8個(gè)位(bit)作為一個(gè)字節(jié)(Byte);
還有一個(gè)概念叫“字/word”适肠,字中的字節(jié)數(shù)是一個(gè)基本的系統(tǒng)參數(shù)霍衫,不同的系統(tǒng)也不相同。一個(gè)word可能是1,2,4憋沿,8個(gè)byte。
8個(gè)位可以表示從0000 0000到1111 1111的256個(gè)數(shù)字
在計(jì)算機(jī)的文本文件里面柠傍,我們看到的英文字符是使用ASCII標(biāo)準(zhǔn)來(lái)表示的。計(jì)算機(jī)中只能存儲(chǔ)0/1的數(shù)字辩稽,我們的文本文件以字節(jié)序列存儲(chǔ)在計(jì)算機(jī)中惧笛,而在讀取和存儲(chǔ)的時(shí)候會(huì)根據(jù)ASCII標(biāo)準(zhǔn)規(guī)定的,將每個(gè)二進(jìn)制數(shù)字表示成字符
ASCII的范圍是0-127逞泄,不在這個(gè)范圍內(nèi)的不是ASCII編碼
另外患整,每行文本都是通過(guò)一個(gè)看不見(jiàn)的換行符"\n"來(lái)結(jié)尾的(就像在c/c++里面可以通過(guò)這個(gè)符號(hào)來(lái)?yè)Q行)
只由ASCII字符構(gòu)成的文件稱為文本文件拜效,其他所有文件稱為二進(jìn)制文件。(二進(jìn)制文件以文本方式打開(kāi)會(huì)亂碼各谚,如果能以正確的方式打開(kāi)的話紧憾,就是數(shù)字)。
所有的數(shù)據(jù)都是由一串比特bit保存的昌渤,區(qū)分不同數(shù)據(jù)對(duì)象的唯一方法是我們讀到這些數(shù)據(jù)對(duì)象時(shí)的上下文赴穗。比如,在不同的上下文中膀息,同樣的字符序列可能表示整數(shù)/浮點(diǎn)數(shù)/字符串/指令望抽。
另外,說(shuō)到ASCII履婉,還有很多其他的編碼,這里不介紹了斟览,大家可以了解
各種字符編碼/標(biāo)準(zhǔn)
2毁腿,大多數(shù)計(jì)算機(jī)以一個(gè)byte作為最小的可尋址的存儲(chǔ)器單位。(也就是說(shuō)地址每變化1苛茂,內(nèi)存變化一byte)已烤。也就是說(shuō)每次訪問(wèn)都會(huì)access一個(gè)byte的內(nèi)容而不是單獨(dú)訪問(wèn)一個(gè)bit。
存儲(chǔ)器的每個(gè)字節(jié)都有一個(gè)唯一的數(shù)字來(lái)標(biāo)識(shí)妓羊,成為地址胯究。所有的可能地址的集合就稱為虛擬地址空間(virtual address apace)
。
正如其名字所表示的躁绸,這個(gè)虛擬地址空間只是一個(gè)展現(xiàn)給機(jī)器級(jí)程序的概念性影響(image)裕循,實(shí)際的實(shí)現(xiàn)使用的是RAM,磁盤存儲(chǔ)净刮,特殊硬件和操作系統(tǒng)軟件的結(jié)合剥哑,來(lái)為程序提供一個(gè)看上去統(tǒng)一的字節(jié)數(shù)組。
-數(shù)據(jù)大醒透浮:
數(shù)據(jù)類型 | 64位 | 32位 |
---|---|---|
char | 1 | 1 |
short int | 2 | 2 |
int | 4 | 4 |
long int | 8 | 4 |
char* | 8 | 4 |
float | 4 | 4 |
double | 8 | 8 |
當(dāng)然這只是一般情況下株婴。
注意32位機(jī)器上一般最長(zhǎng)4個(gè)字節(jié),只有double是8個(gè)字節(jié)
尋址和字節(jié)存儲(chǔ)#
多字節(jié)對(duì)象被存儲(chǔ)為連續(xù)的字節(jié)序列暑认,對(duì)象的地址為所使用字節(jié)序列的最小地址困介。
比如一個(gè)4byte的int型數(shù)據(jù)的首地址為0x100 ,那么這個(gè)數(shù)據(jù)會(huì)被存儲(chǔ)在0x100,0x101,0x102,0x103.
下面就涉及到對(duì)表示的對(duì)象的字節(jié)序列排序,假設(shè)一個(gè)數(shù)據(jù)有w位蘸际,那么最高字節(jié)為{x[w-1],x[w-2]...x[w-8]},最低字節(jié)為{x[7],x[6]....x[0]}座哩;
如果機(jī)器選擇在存儲(chǔ)器里按照最低有效字節(jié)到最高有效字節(jié)的順序存儲(chǔ)對(duì)象,那么就是小端法(little endian);Intel的機(jī)器采用這種規(guī)則粮彤。
如果機(jī)器按照從最高有效字節(jié)到最低有效字節(jié)的順序存儲(chǔ)八回,那么就是大端法(big endian).
c中的移位運(yùn)算:#
除了我們聽(tīng)說(shuō)過(guò)的左移右移酷愧,實(shí)際上實(shí)現(xiàn)的方式有兩種,一種是邏輯移位缠诅,就是"平移",補(bǔ)0溶浴;
第二種是算術(shù)移位。算術(shù)移位是大多數(shù)機(jī)器在對(duì)有符號(hào)數(shù)據(jù)移位時(shí)使用的方法管引。算術(shù)右移是在左端空出的所有位置補(bǔ)上最高位士败。如果是負(fù)數(shù),那么補(bǔ)1褥伴,正數(shù)補(bǔ)0.
但在對(duì)無(wú)符號(hào)數(shù)據(jù)移位時(shí)必須使用邏輯移位谅将。
這個(gè)大家了解一下,因?yàn)槠綍r(shí)用的并不太多重慢。
二進(jìn)制補(bǔ)碼(這個(gè)最好看完饥臂,不然會(huì)有誤解啊)#
x[complement]=~x-1;
然后發(fā)現(xiàn)了一個(gè)求負(fù)數(shù)補(bǔ)碼值的方法:
假設(shè)負(fù)數(shù)的補(bǔ)碼為:1x[n-2]x[n-3]...x[0]
那么其值為:將最高位替換為0變成整數(shù)似踱,得到的數(shù)X[positive],減去最高位的值隅熙,如果為n位的話,就是2^(n-1)(插入公式略麻煩核芽,就這樣描述一下囚戚。。)
舉個(gè)例子:1100 1111 1100 0111計(jì)算的話就是:100 1111 1100 0111-1000 0000 0000 0000=-12345
后來(lái)在wiki上也看見(jiàn)了
計(jì)算二補(bǔ)數(shù)(two's complement):
正數(shù)的二補(bǔ)數(shù)是負(fù)數(shù)轧简,負(fù)數(shù)的二補(bǔ)數(shù)是正數(shù)驰坊。
12345=0011 0000 0011 1001
-12345不用補(bǔ)碼表示,僅用符號(hào)位:
1011 0000 0011 1001
取反得: 1100 1111 1100 0110
+1得: 1100 1111 1100 0111(絕對(duì)值直接加一)
感覺(jué)wiki這個(gè)規(guī)律也蠻不錯(cuò)的哮独,可恥的再次copy:
但是要指出的是拳芙,二補(bǔ)數(shù)的概念和平時(shí)的補(bǔ)碼概念并不太一樣,
補(bǔ)碼的概念是這樣的:
正數(shù)的補(bǔ)碼就是其本身
負(fù)數(shù)的補(bǔ)碼是在其原碼的基礎(chǔ)上, 符號(hào)位不變, 其余各位取反, 最后+1. (即在反碼的基礎(chǔ)上+1)
在wiki上看到了另一個(gè)方法:
最開(kāi)始感覺(jué)蠻震驚皮璧,后來(lái)一想态鳖,不過(guò)是最右邊所有的0轉(zhuǎn)換過(guò)后全為1,然后還有一個(gè)加一的步驟恶导,加一之后這些11...1又變成了00..0浆竭,然后產(chǎn)生進(jìn)1,又給了那個(gè)1惨寿,所以這個(gè)1以及之后的0都不變邦泄。
這個(gè)方法大家可以不用記,了解原理就好裂垦。
有符號(hào)和無(wú)符號(hào)的轉(zhuǎn)換
從二進(jìn)制補(bǔ)碼到無(wú)符號(hào)數(shù):
正數(shù)不變
負(fù)數(shù):T2U(x)=x+2^w;
如T2U(-12345)=2^16-12345;
從無(wú)符號(hào)變?yōu)槎M(jìn)制補(bǔ)碼表示的有符號(hào)數(shù):
U2T(x)=x-2w;當(dāng)x>=2(w-1)
舉個(gè)例子很好理解顺囊,這個(gè)公式也解釋了從負(fù)數(shù)二進(jìn)制補(bǔ)碼計(jì)算其值的方法(上面有講)。