有符號數處理

计算机进行运算时,需要将负数编码至二进制形式,所用的编码方法称为有符号数的表示

数学中,可以在任意基数的数前面添加负号“−”来表示负数。然而在随机存取存储器寄存器中,数据均以一系列二进制位表示而没有额外的标志,因此需要一种编码负号的方法。当前有四种方法,用于扩展二进制数字系统,来表示有符号数:原码sign-and-magnitude)、反码ones' complement)、补码two's complement)以及移码offset binaryexcess-N)。

原码 编辑

8位原码
二进制符號及值无符号
00000000+00
0000000111
.........
01111111127127
10000000−0128
10000001−1129
.........
11111111−127255

符號及值(sign & magnitude)的处理办法是分配一个符号位(sign bit)来表示这个符号:设置这个(通常为最高有效位)为0表示一个正数,为1表示一个负数。数字中的其它位指示数值(或者绝对值)。因此一个字节只有7位(除去符号位),数值的范围从0000000(0)到1111111(127)。这样当你增加一个符号位(第八位)后,可以表示从−12710到+12710的数字。这种表示法导致的结果就是可以有两种方式表示零,00000000(0)与10000000(−0),這大大增加數碼電路的複雜性和設計難度。CPU亦須執行兩次比較,來測試運算結果是否為零。

十进制数−43用原码方法编码成八位的结果为10101011。

这种方法被直接比较于常用的符号表示法(放置一个“+”或者“−”在数字的数值之前)。一些早期的二进制电脑(例如IBM 7090)使用这种表示法,也许是由于它与通用用途的自然联系。原码是最常用的表示浮點數的方法。IEEE二進位浮點數算術標準(IEEE 754)採用最高有效位作為符号位,因此可表示正負及正負無限

反码 编辑

8位反码
二进制值反码表示无符号数表示
00000000+00
0000000111
.........
01111101125125
01111110126126
01111111127127
10000000−127128
10000001−126129
10000010−125130
.........
11111110−1254
11111111−0255

另一方面,一种叫做反码ones' complement)的系统也可以用于表示负数(注:正数与原码形式一样,无需取反)。一个负数的二进制数反码形式为其绝对值部分按位取反(即符号位不变,其余各位按位取反)。同原码表示一样,0的反码表示形式也有两种:00000000(+0)与11111111(−0)。

例如,原码10101011(-43)的反码形式为11010100(−43)。有符号数用反码表示的范围为−(2N−1−1)到(2N−1−1),以及+/−0。一個慣常的八位的字節便是(可表示)−12710到+12710,以及00000000(+0)或者11111111(−0)。

对两个反码表示形式的数字做加法,首先需要进行常规的二进制加法,但还需要在和的基础上加上进位。下面是一个−1加上+2的例子。

       二进制    十进制    11111110     -1 +  00000010     +2............    ...  1 00000000      0   <-- 错误答案           1     +1   <-- 加上进位............    ...    00000001      1   <-- 正确答案

在上面的例子中,二进制加法仅仅得到了00000000,这是一个错误的答案。只有当加上进位时才能得到正确答案(00000001)。

反码这种数字表示系统通常出现在老式的计算机中;PDP-1CDC 160AUNIVAC 1100/2200系列以及其它的一些电脑都使用反码算术。

关于正字法(orthography)的评述:这个系统之所以被称作反码(ones' complement)是因为一个正值x的反(表示为按位非x)也可以通过0的反码(ones' complement)表示形式(一长串的1,−0)减去x得到。

Internet协议IPv4ICMPUDP以及TCP都使用同样的16位反码检验和算法。虽然大多数计算机缺少“循环进位”硬件,但是这种额外的复杂性是可以接受的,因为“对于所有位(bit)位置上的错误都是同样敏感的”。[1]UDP中,全0表示省略了可选的检验和特性。另外一种表示:FFFF,指示了0的检验和。[2] (在IPv4中,TCP和ICMP都强制性地规定了检验和,而在IPv6中可以省略)。

注意负数的反码只需按位求数值的补码就可以得到,符号不需要变动

补码 编辑

8位补码
二进制值补码表示无符号数表示
0000000000
0000000111
.........
01111110126126
01111111127127
10000000−128128
10000001−127129
10000010−126130
.........
11111110−2254
11111111−1255

补码two's complement)回避了0有多种表示的问题以及循环进位的需要。在补码表示中,负数以位模式表示为正值的反码加1(当作无符号数)。

在补码表示中,只有一个0(00000000)。求一个数的补码(无论是负数还是正数)需要反转所有位,然后加1。一对补码整数相加等价于一对无符号数相加(除了溢出检测,如果能够做到的话)。比如,从旁边的表格可以看出,127与−128的补码表示相加就与无符号数127及128相加具有相同的结果。

从一个正数得到其对应负数的补码的简单方法表示如下:

例1例2
1. 从右边开始,找到第一个'1'01010010101100
2. 反转从这个'1'之后开始到最左边的所有位10101111010100

移码 编辑

移码(offset binary),是将二进制原码无符号整数所代表的值,减去一个预设值。

标准移码,预设值为二进制原码表示的最大整数的一半。 一个数的标准移码和补码,最高位相反,其余各位均相同。

表示方式 编辑

下表列出了 4-bit 二進數所能表示的整數:

  • 無符號(unsigned)可表示0到15
  • 符號及值(sign & magnitude)可表示-7到+7,包括-0
  • 一補碼(ones' complement)可表示-7到+7,包括-0
  • 二補碼(two's complement)可表示-8到+7,沒有±0的問題
二進數無符號符號位元一補碼二補碼
00000000
00011111
00102222
00113333
01004444
01015555
01106666
01117777
10008-0-7-8
10019-1-6-7
101010-2-5-6
101111-3-4-5
110012-4-3-4
110113-5-2-3
111014-6-1-2
111115-7-0-1

参见 编辑

参考资料 编辑

  1. ^ Braden, R. Computing the Internet Checksum (RFC 1071). The Internet Engineering Task Force. 1988 [2009-06-11]. (原始内容存档于2020-10-21). 
  2. ^ Postel, J. User Datagram Protocol (RFC 768). The Internet Engineering Task Force. 1980 [2009-06-11]. (原始内容存档于2012-07-22).