注:之前查找了關于原碼衣陶、反碼柄瑰、補碼的相關資料,張子秋的博客:原碼, 反碼, 補碼 詳解講的比較透徹剪况。為了方便教沾,現(xiàn)將其轉(zhuǎn)載至此,版權(quán)歸原作者所有译断。更加深入的分析授翻,可以參考作者的原文。
本文大部分內(nèi)容來源于此孙咪。后面有小部分關于“大數(shù)溢出”的問題為本人補充堪唐。
作者:張子秋
出處:http://www.cnblogs.com/zhangziqiu/
機器數(shù)和真值
機器數(shù)
一個數(shù)在計算機中的二進制表示形式, 叫做這個數(shù)的機器數(shù)。機器數(shù)是帶符號的翎蹈,在計算機用一個數(shù)的最高位存放符號, 正數(shù)為0, 負數(shù)為1.
比如淮菠,十進制中的數(shù) +3 ,計算機字長為8位荤堪,轉(zhuǎn)換成二進制就是00000011兜材。如果是 -3 ,就是 10000011 逞力。那么,這里的 00000011 和 10000011 就是機器數(shù)糠爬。
真值
因為第一位是符號位寇荧,所以機器數(shù)的形式值就不等于真正的數(shù)值。例如上面的有符號數(shù) 10000011执隧,其最高位1代表負揩抡,其真正數(shù)值是 -3 而不是形式值131(10000011轉(zhuǎn)換成十進制等于131)。所以镀琉,為區(qū)別起見峦嗤,將帶符號位的機器數(shù)對應的真正數(shù)值稱為機器數(shù)的真值。
例:0000 0001的真值 = +000 0001 = +1屋摔,1000 0001的真值 = –000 0001 = –1
原碼
原碼就是符號位加上真值的絕對值, 即用第一位表示符號, 其余位表示值. 比如如果是8位二進制:
[+1]原 = 0000 0001
[-1]原 = 1000 0001
第一位是符號位. 因為第一位是符號位, 所以8位二進制數(shù)的取值范圍就是:
[1111 1111 , 0111 1111]烁设,即:
[-127 , 127]
原碼是人腦最容易理解和計算的表示方式.
反碼
反碼的表示方法是:正數(shù)的反碼是其本身;的反碼是在其原碼的基礎上, 符號位不變钓试,其余各個位取反装黑。
[+1] = [00000001]原 = [00000001]反
[-1] = [10000001]原 = [11111110]反
可見如果一個反碼表示的是負數(shù), 人腦無法直觀的看出來它的數(shù)值. 通常要將其轉(zhuǎn)換成原碼再計算。
補碼
補碼的表示方法是:正數(shù)的補碼就是其本身弓熏;的補碼是在其原碼的基礎上, 符號位不變, 其余各位取反, 最后+1. (即在反碼的基礎上+1)
[+1] = [00000001]原 = [00000001]反 = [00000001]補
[-1] = [10000001]原 = [11111110]反 = [11111111]補
對于負數(shù), 補碼表示方式也是人腦無法直觀看出其數(shù)值的. 通常也需要轉(zhuǎn)換成原碼在計算其數(shù)值.
為何要使用原碼, 反碼和補碼
在開始深入學習前, 我的學習建議是先”死記硬背”上面的原碼, 反碼和補碼的表示方式以及計算方法.
現(xiàn)在我們知道了計算機可以有三種編碼方式表示一個數(shù). 對于正數(shù)因為三種編碼方式的結(jié)果都相同:
[+1] = [00000001]原 = [00000001]反 = [00000001]補
所以不需要過多解釋. 但是對于負數(shù):
[-1] = [10000001]原 = [11111110]反 = [11111111]補
可見原碼, 反碼和補碼是完全不同的. 既然原碼才是被人腦直接識別并用于計算表示方式, 為何還會有反碼和補碼呢?
首先, 因為人腦可以知道第一位是符號位, 在計算的時候我們會根據(jù)符號位, 選擇對真值區(qū)域的加減. (真值的概念在本文最開頭). 但是對于計算機, 加減乘數(shù)已經(jīng)是最基礎的運算, 要設計的盡量簡單. 計算機辨別”符號位”顯然會讓計算機的基礎電路設計變得十分復雜! 于是人們想出了將符號位也參與運算的方法. 我們知道, 根據(jù)運算法則減去一個正數(shù)等于加上一個負數(shù), 即: 1-1 = 1 + (-1) = 0 , 所以機器可以只有加法而沒有減法, 這樣計算機運算的設計就更簡單了.
于是人們開始探索 將符號位參與運算, 并且只保留加法的方法. 首先來看原碼恋谭。計算十進制的表達式: 1-1=0
1 - 1 = 1 + (-1) = [00000001]原 + [10000001]原 = [10000010]原 = -2
如果用原碼表示, 讓符號位也參與計算, 顯然對于減法來說, 結(jié)果是不正確的.這也就是為何計算機內(nèi)部不使用原碼表示一個數(shù).
為了解決原碼做減法的問題, 出現(xiàn)了反碼。計算十進制的表達式:
1-1=0
1 - 1 = 1 + (-1)
= [0000 0001]原 + [1000 0001]原
= [0000 0001]反 + [1111 1110]反
= [1111 1111]反 = [1000 0000]原
= -0
發(fā)現(xiàn)用反碼計算減法, 結(jié)果的真值部分是正確的. 而唯一的問題其實就出現(xiàn)在”0”這個特殊的數(shù)值上. 雖然人們理解上+0和-0是一樣的, 但是0帶符號是沒有任何意義的. 而且會有[0000 0000]原和[1000 0000]原兩個編碼表示0.
于是補碼的出現(xiàn), 解決了0的符號以及兩個編碼的問題:
1-1 = 1 + (-1)
= [0000 0001]原 + [1000 0001]原
= [0000 0001]補 + [1111 1111]補
= [0000 0000]補=[0000 0000]原
這樣0用[0000 0000]表示, 而以前出現(xiàn)問題的-0則不存在了.而且可以用[1000 0000]表示-128:
(-1) + (-127) = [1000 0001]原 + [1111 1111]原
= [1111 1111]補 + [1000 0001]補
= [1000 0000]補
-1-127的結(jié)果應該是-128, 在用補碼運算的結(jié)果中, [1000 0000]補 就是-128. 但是注意因為實際上是使用以前的-0的補碼來表示-128, 所以-128并沒有原碼和反碼表示.(對-128的補碼表示[1000 0000]補算出來的原碼是[0000 0000]原, 這是不正確的)
使用補碼, 不僅僅修復了0的符號以及存在兩個編碼的問題, 而且還能夠多表示一個最低數(shù). 這就是為什么8位二進制, 使用原碼或反碼表示的范圍為[-127, +127], 而使用補碼表示的范圍為[-128, 127].
因為機器使用補碼, 所以對于編程中常用到的32位int類型, 可以表示范圍是: [-2^31, 2^31-1] 因為第一位表示的是符號位.而使用補碼表示時又可以多保存一個最小值.
補碼表示的溢出問題
以下是本人的補充的理解挽鞠,不知道是否正確:
由于計算機中的數(shù)字用補碼表示疚颊,例如8bit的byte類型的表示范圍為:
[-128, 127]
0 = [0000 0000](補)
-128 = [1000 0000](補)
127 = [0111 1111](補)
當byte類型的變量超上限127時狈孔,如:
+128 = -(-128)= 127 + 1
= [1111 1111](補)+ [0000 0001](補)
= [1000 0000](補)
= -128
+129 = 127 + 2
= [1111 1111](補)+ [0000 0001](補)
= [1000 0001](補)
= [1111 1111](原)
= -127
當byte類型的變量超過下限-128時:
-129 = -128 - 1
= [1000 0000](補) - [0000 0001](補)
= [0111 1111](補)
= 127
-130 = -128 - 2
= [1000 0000](補) - [0000 0010](補)
= [0111 1110](補)
= 126
大數(shù)溢出問題
int類型在32位系統(tǒng)中占4個字節(jié)、32bit材义,補碼表示的的數(shù)據(jù)范圍為:
[10000000 00000000 00000000 00000000] ~ [01111111 11111111 11111111 11111111]
[?231,231?1]
[-2147483648, 2147483647]