閑扯原碼,補碼和反碼
始發于goal00001111的專欄;允許自由轉載,但必須注明作者和出處
人類習慣使用十進制數進行數值計算,而計算機則采用二進制,所以為了讓計算機幫助人類計算,首先要把十進制數轉換為二進制數。本文以最簡單的8位定點整數為例,分析了計算機存儲和計算數值的方法。
地球人都知道,整數有正負之分,但計算機卻只認得“0”“1”,不知道符號“+”和“-”,所以有必要用“0”“1”來表示“+”“-”。人們規定用“0”表示“+”,用“1”表示“-”。
這樣,我們就可以表示出計算機能識別的整數了,我們把符號數值化后的二進制數稱為機器數,相對應的,符號沒有數值化(即仍用“+”“-”號表示)的二進制數稱為真值。計算機只能處理機器數,不認識真值,真值是給人類看的。
機器數有三種編碼形式,分別稱為:原碼,補碼和反碼。為什么要搞得這么復雜,那些計算機科學家真的是吃飽了沒事干嗎?且聽我慢慢道來:
其實篇頭已經介紹了機器碼的一種形式——原碼,它的特點是有效數值部分照抄真值,符號“+”“-”分別用“0”“1”表示。
例如,十進制數+6,它的真值是+000 0110(注意:8位二進制數最高位是符號位,所以其真值只有7位),對應的原碼就是0000 0110。
又如,十進制數-6,它的真值是-000 0110,對應的原碼就是1000 0110。
原碼表示法比較直觀,它的數值部分就是該數的絕對值,而且與真值的轉換十分方便。但是它的加減法運算較復雜,當兩數相加時,機器要首先判斷兩數的符號是否相同,如果相同則兩數相加,若符號不同,則兩數相減。在做減法前,還要判斷兩數絕對值的大小,然后用大數減去小數,最后再確定差的符號,換言之,用這樣一種直接的形式進行加運算時,負數的符號位不能與其數值部分一道參加運算,而必須利用單獨的線路確定和的符號位。要實現這些操作,電路就很復雜,這顯然是不經濟實用的。為了減少設備,解決機器內負數的符號位參加運算的問題,總是將減法運算變成加法運算,也就引進了反碼和補碼這兩種機器數。
那如何將減法運算轉化為加法運算呢?
首先引入 “模”的概念,“模”是指一個計量系統的計數范圍。以我們每天用來算時間的時鐘為例,時鐘的計量范圍是0~11,所以它的模就等于12。計算機也可以看成一個計量機器,它也有一個計量范圍,即存在一個“模”。 機器字長為n位的計算機的計量范圍是0~2^n-1,模=2^n。
“模”實質上是計量器產生“溢出”的量,它的值在計量器上表示不出來,計量器上只能表示出模的余數。例如,雖然時鐘的模=12,但是在時鐘的指針并不能真正指向“12點”,“12點”的位置和“0點”是重合的!用C語言表示就是12%12 == 0。
任何有模的計量器,均可化減法為加法運算。這是為什么呢?
仍然以時鐘為例,假設當前時針指向10點,而準確時間是6點,調整時間可有以下兩種撥法:
一種是倒撥4小時,即:10-4=6
另一種是順撥8小時:10+8=12+6=6
在以12為模的系統中,加8和減4效果是一樣的,因此凡是減4運算,都可以用加8來代替。
對“模”12而言,8和4互為補數。插一句,所謂“補數”,實際上是模擬了數學中“補角”的概念,如果兩個角的度數之和為180度,我們就稱這兩個角互為補角。同樣的,如果在某個計量系統中,兩個數之和剛好等于模,則它們互為“補數”,例如,在以12為模的系統中,11和1,10和2,9和3,7和5,6和6都互為補數。
對于計算機,其概念和方法完全一樣。機器字長為n位的計算機,設n=8, 所能表示的最大數是11111111,若再加1稱為100000000(9位),但因只有8位,最高位1自然丟失,又回了00000000,所以8位二進制系統的模為2^8。 在這樣的系統中減法問題可以化成加法問題,只需把減數用相應的補數表示就行了。
把補數用到計算機對數據的處理上,就是補碼。補碼也是一種機器碼,它克服了原碼的一些缺陷,一方面使符號位能與有效值部分一起參加運算,從而簡化運算規則;另一方面使減法運算轉換為加法運算,進一步簡化計算機中運算器的線路設計。現代的計算機都是用補碼的形式來存儲數據和進行算術運算的。
那補碼是如何編碼的,即我們如何將一個整數的真值轉換為一個8位補碼呢?
回到最初的例子,十進制數+6。我們已經知道了它真值是+000 0110,原碼是0000 0110。并且用自然語言介紹了如何實現真值和原碼的轉換。但是,一個眾所周知的事實是:“自然語言”不如“數學語言”嚴謹!我們希望能夠用數學表達式來表示真值和原碼的關系,這就是:
設機器字長為N位,真值為X,則:
[X]原 = X, 0 <= X < 2^(n-1)
[X]原 = 2^(n-1) - X, -2^(n-1) < X <= 0
如何來理解這個公式呢?
仍以十進制數+6和-6為例:
[+6]原 = 6,把6轉換為8位二進制數,就得到原碼0000 0110。(本文的最后將會提供一個把十進制數轉換為機器碼的C++算法實現)。
[-6]原 = 2^(8-1) – (-6) = 256 + 6 = 262,,把262轉換為8位二進制數,就得到原碼1000 0110。即最高位本來是0,加了一個2^(8-1)后,最高位就變成1了。
同樣我們給出補碼的數學表達式:
[X]補 = X, 0 <= X < 2^(n-1)
[X]補 = 2^n + X, -2^(n-1) <= X < 0
和原碼一樣,正數的補碼就等于真值,那如何理解負數的補碼呢?
例如,[-6]補 = 2^8 + (-6) = 512 – 6 = 506。
且慢,這個506怎么這么熟悉!它不正是以2^8為模的6的“補數”嗎?原來負數的補碼就等于它的絕對值的補數啊!
把506轉換為8位二進制數,就得到-6的補碼1111 1010。
得到某個數的補碼后,我們就可以把減法運算轉化為加法運算了。
補碼加法的運算法則為:[X +Y]補 = [X] 補 + [Y] 補
例1:X =+011 0011,Y=+010 1001,求[X+Y] 補
解:[X +Y]補 = [X] 補 + [Y] 補 = 0011 0011 + 0010 1001 = 0101 1100
例2:X =+011 0011,Y=-010 1001,求[X+Y] 補
解:[X +Y]補 = [X] 補 + [Y] 補 = 0011 0011 + 1101 0111 = 0000 1010 (進位溢出)
注:因為計算機中運算器的位長是固定的(本例中只有8位),上述運算中產生的最高位進位將丟掉,所以結果不是1 0000 1010,而是0000 1010。
補碼減法公式:[X - Y]補 = [X] 補 - [Y] 補= [X] 補 + [-Y] 補
其中:[-Y]補稱為負補,求負補的辦法是:對補碼的每一位(包括符合位)求反,且未位加1。
例3:X =+011 0011,Y=+010 1001,求[X-Y] 補
解:[X - Y]補 = [X] 補 + [-Y] 補 = 0011 0011 + 1101 0111 = 0000 1010 (進位溢出)
例2:X =+011 0011,Y=-010 1001,求[X-Y] 補
解:[X - Y]補 = [X] 補 + [-Y] 補 = 0011 0011 + 0010 1001 = 0101 1100
根據補碼加減運算得到的結果仍然是補碼,若要將補碼轉換成原碼,只要對其再求一次補碼就行了。
再來說說反碼。當初引入反碼是為了解決原碼運算所遇到的困難,但由于反碼自身也存在一定的缺陷,加之補碼在機器運算中的優越表現,完全掩蓋了反碼的光芒,以至于現在人們之所以提到反碼,只是因為在用筆算將真值轉換為補碼的時候,可以快一些——先將原碼轉換為反碼,然后反碼加1,就得到了補碼——但是對于計算機來說,反碼這個中介完全是沒有必要的。
反碼和原碼的關系很緊密,反碼表示法規定:正數的反碼與其原碼相同;負數的反碼是對其原碼逐位取反,但符號位除外。
同樣我們給出反碼的數學表達式:
[X]反 = X, 0 <= X < 2^(n-1)
[X]反 = 2^n – 1 + X, -2^(n-1) < X <= 0
從數學表達式中我們可以發現,整數的三種機器碼都是相同的,而負數的則不同。負數的反碼是對原碼按位求反(符合位除外),而補碼則等于反碼加1。這樣有了反碼這個中介,我們即使是用筆算也能夠很快地將原碼轉換為補碼了。例如:
[+6]反 = 6, [-6]反 = 2^(8-1) – 1 + (-6) = 255 + 6 = 261,,把261轉換為8位二進制數,就得到反碼1111 1001。
由于-6的原碼為1000 0110,我們稍作觀察,就可找到反碼和原碼的關系。
再將反碼加1,就得到-6的補碼1111 1010。
現在明白了吧?
附錄:把十進制數轉換為機器碼的C++程序代碼
#include <iostream>
using namespace std;
const int MAX = 32;
void Binary(char b[], int x); //將x轉換為二進制數
void TrueForm(char b[], int x); //獲取原碼
void RadixMinus(char b[], int x); //獲取反碼
void Complement(char b[], int x); //獲取補碼
void TruthValue(char b[], int x);//獲取真值
int main()
{
int x = 1;
char b[MAX+1]={0};
cout << "十進制數:" << x << endl;
TruthValue(b, x);//獲取真值
cout << "真值:" << b << endl;
TrueForm(b, x); //獲取原碼
cout << "原碼:" << b << endl;
RadixMinus(b, x);//獲取反碼
cout << "反碼:" << b << endl;
Complement(b, x);//獲取補碼
cout << "補碼:" << b << endl;
cout << "十進制數:" << -x << endl;
TruthValue(b, -x);//獲取真值
cout << "真值:" << b << endl;
TrueForm(b, -x); //獲取原碼
cout << "原碼:" << b << endl;
RadixMinus(b, -x);//獲取反碼
cout << "反碼:" << b << endl;
Complement(b, -x);//獲取補碼
cout << "補碼:" << b << endl;
system("pause");
return 0;
}
void Binary(char b[], int x)//將x轉換為二進制數
{
for (int i=MAX-1; i>=0; i--)
{
b[i] = (x & 1) + '0';
x >>= 1;
}
b[MAX] = '\0';
}
void TrueForm(char b[], int x) //獲取原碼:根據數學表達式求得
{
if (x >= 0)
Binary(b, x);
else
Binary(b, (1<<(MAX-1)) - x);
}
void RadixMinus(char b[], int x) //獲取反碼:正數的反碼=補碼;負數的反碼=補碼-1
{
if (x >= 0)
Binary(b, x);
else
Binary(b, x - 1);
}
void Complement(char b[], int x) //獲取補:數據在計算機中以補碼形式存儲,直接轉換即可
{
Binary(b, x);
}
void TruthValue(char b[], int x)//獲取真值:根據原碼獲得真值
{
TrueForm(b, x);
b[0] = (b[0] == '0') ? '+' : '-';
}
參考文獻:
(1)Boater的博客:《反碼和補碼技術是怎樣被提出的?》
http://blog.tianya.cn/blogger/post_show.asp?BlogID=227218&PostID=7046448
(2)北半球的孤獨發帖:《關于機器數的幾點注記》
http://forum.noi.cn/thread-29319-1-1.html
本文來自CSDN博客,轉載請標明出處:http://blog.csdn.net/goal00001111/archive/2010/04/15/5490612.aspx