C语言深入理解原码，反码，补码

一：前提引入

在计算机中，一个字节8位，可以表示2^8=256没有符号数那就是-128~+128，但实际上范围却是-128到127，这是为什么？其实产生这个问题的根本原因就是我们习惯用人的思维来思考计算机做的事。在探究原因之前，我们先来看一下学过的几种编码方式。

二：编码方式介绍

（1）原码

原码就是符号位加上真值的绝对值, 即用第一位表示符号, 其余位表示值。比如如果是8位二进制。

[+1]原 = 0000 0001

[-1]原 = 1000 0001

第一位是符号位. 因为第一位是符号位, 所以8位二进制数的取值范围就是:

[1111 1111 , 0111 1111]

即

[-127 , 127]

原码是人脑最容易理解和计算的表示方式。

（2）反码

正数的反码是其本身

负数的反码是在其原码的基础上，符号位不变，其余各个位取反。

[+1] = [00000001]原 = [00000001]反

[-1] = [10000001]原 = [11111110]反

可见如果一个反码表示的是负数, 人脑无法直观的看出来它的数值. 通常要将其转换成原码再计算.

（3）补码

正数的补码就是其本身

负数的补码是在其原码的基础上,，符号位不变，其余各位取反，最后+1。(即在反码的基础上+1)

[+1] = [00000001]原 = [00000001]反 = [00000001]补

[-1] = [10000001]原 = [11111110]反 = [11111111]补

对于负数, 补码表示方式也是人脑无法直观看出其数值的. 通常也需要转换成原码在计算其数值。

三：使用源码、反码和补码的原因

现在我们知道了计算机可以有三种编码方式表示一个数。对于正数因为三种编码方式的结果都相同:

[+1] = [00000001]原 = [00000001]反 = [00000001]补

所以不需要过多解释。但是对于负数:

[-1] = [10000001]原 = [11111110]反 = [11111111]补

可见原码, 反码和补码是完全不同的。既然原码才是被人脑直接识别并用于计算表示方式, 为何还会有反码和补码呢?

首先, 因为人脑可以知道第一位是符号位，在计算的时候我们会根据符号位，选择对真值区域的加减。

但是对于计算机，加减乘数已经是最基础的运算，要设计的尽量简单。计算机辨别”符号位”显然会让计算机的基础电路设计变得十分复杂! 于是人们想出了将符号位也参与运算的方法。我们知道，根据运算法则减去一个正数等于加上一个负数，即: 1-1 = 1 + (-1) = 0 , 所以机器可以只有加法而没有减法，这样计算机运算的设计就更简单了。

于是人们开始探索

将符号位参与运算, 并且只保留加法的方法

. 首先来看原码:

（1）原码运算

计算十进制的表达式: 1-1=0

1 – 1 = 1 + (-1) = [00000001]原 + [10000001]原 = [10000010]原 = -2

如果用原码表示，让符号位也参与计算，显然对于减法来说，结果是不正确的。这也就是为何计算机内部不使用原码表示一个数。

（2）反码运算

为了解决原码做减法的问题, 出现了反码:

计算十进制的表达式: 1-1=0

1 – 1 = 1 + (-1) = [0000 0001]原 + [1000 0001]原= [0000 0001]反 + [1111 1110]反 = [1111 1111]反 = [1000 0000]原 = -0

发现用反码计算减法, 结果的真值部分是正确的。而唯一的问题其实就出现在”0″这个特殊的数值上。虽然人们理解上+0和-0是一样的，但是0带符号是没有任何意义的。而且会有[0000 0000]原和[1000 0000]原两个编码表示0。

（3）补码运算

于是补码的出现，解决了0的符号以及两个编码的问题:

1-1 = 1 + (-1) = [0000 0001]原 + [1000 0001]原 = [0000 0001]补 + [1111 1111]补 = [0000 0000]补=[0000 0000]原

这样0用[0000 0000]表示, 而以前出现问题的-0则不存在了。而且可以用[1000 0000]表示-128。

（4）-128

(-1) + (-127) = [1000 0001]原 + [1111 1111]原 = [1111 1111]补 + [1000 0001]补 = [1000 0000]补

-1-127的结果应该是-128，在用补码运算的结果中， [1000 0000]补就是-128。但是注意因为实际上是使用以前的-0的补码来表示-128，所以-128并没有原码和反码表示。(对-128的补码表示[1000 0000]补算出来的原码是[0000 0000]原，这是不正确的)

使用补码，不仅仅修复了0的符号以及存在两个编码的问题, 而且还能够多表示一个最低数. 这就是为什么8位二进制，使用原码或反码表示的范围为[-127, +127], 而使用补码表示的范围为[-128, 127]。

因为机器使用补码，所以对于编程中常用到的32位int类型，可以表示范围是: [-2
³¹
,2
³¹
-1] 因为第一位表示的是符号位.而使用补码表示时又可以多保存一个最小值。

四：背后的数学原理（也就是如何发明的反码和补码）

设计一个东西，肯定是为了解决某种问题的，先来看下原码的运算；

1+1=[0000 0001]原+[0000 0001]原=[0000 0010]原=2,

正确

1-1=1+(-1)=[0000 0001]原+[1000 0001]原=[1000 0010]原=-2，

错误

-1-1=-1+（-1）=[1000 0001]原+[1000 0001]原=[0000 0010]原=2，

错误

1-2=1+（-2）=[0000 0001]原+[1000 0010]原=[1000 0011]原=-3，

错误

可以看出，正负运算结果出错，正数相互运算结果正确，负数运算结果符号位错误，真值却正确。

然后，我把正负数的编码写了出来。

在这里插入图片描述

来看这个图，这是原码的二进制编码，发现了什么规律？

除去符号位，对于正数的真值部分，是顺序递增（+0到+127）的，但是对于负数来说，却是递减的（-127到-0），并且正数部分运算正确，负数运算符号位确出错，那么是不是由于这个递增递减的问题？我们举个例子算一下。因为正数结果正确，所以假定正数的原码和补码（暂时把反过来的称作反码，虽然不够严谨）一样，那么我们把负数部分反过来，然后用反过来的数值计算试试

然后我们来看

1-1=1+(-1)=[0000 0001]原+[1000 0001]原=[0000 0001]反+[1111 1110]反=[1111 1111]反=[1000 0000]原=-0，

正确？

1-2=1+(-2)=[0000 0001]原+[1000 0010]原=[0000 0001]反+[1111 1101]反=[1111 1110]反=[1000 0001]原=-1，

正确

-1-1=-1+(-1)=[1000 0001]原+[1000 0001]原=[1111 1110]反+[1111 1110]反=[1111 1100]反=[1000 0011]原=-3，

错误

算完问题又出来了，为什么-1-1算出来却是-3，而不是-2；并且1-1算出来却是-0，而不是0？

这是因为计算机这种表示中有2个0导致的，+0和-0，这导致没跨过-0一次就会有1个单位的误差，也就出少了一个1，那我们把这个1给他加上不就行了，

这就出现了我们现在的补码，也就是

补码=反码+1

，然后我们来算一下。

-1-1=-1+(-1)=[1000 0001]原+[1000 0001]原=[1111 1110]反+[1111 1110]反=[1111 1111]补+[1111 1111]补=[1111 1110]补=[1000 0010]原=-2，

正确

1-1=1+(-1)=[0000 0001]原+[1000 0001]原=[0000 0001]反+[1111 1110]反=[0000 0001]补+[1111 1111]补=[0000 0000]补=[0000 0000]原=+0，

正确

那么，现在-0就没有什么作用了，所以我们把-0（1000 0000）规定为-128的码。也就是在8位有符号数中，用1000 0000来代表-128；

综上，就是整个计算机中反码，补码的由来；

最后，附上这几种码的转换；

负数：补码=反码+1；反码=原码的真值部分取反；

原码=补码真值部分取反+1=（补码-1）真值部分取反；

有问题，欢迎大家讨论！！！

参考文章：

https://blog.csdn.net/chenchao2017/article/details/79733278

https://www.sohu.com/a/330680640_468739

原文链接：https://blog.csdn.net/qq_45906993/article/details/120116309

目录