二进制数

我们用十进制计数是因为我们有10根手指，如果将数字系统建立成八进制数字系统或四进制数字系统，甚至二进制系统也是合情合理。

二进制系统存在一点特殊性。这个特殊性在于它是人们所能得到的最简单的数字系统。二进制数字系统中只有两个数字——0和1.

bit被创造出来代表者”binary digit”,。1bit不仅仅是用来计数的二进制数字所包含的意义。在计算机时代，bit被看作是组成信息块的基本单位。

这意味着1bit表示的是可能存在的最小信息量，复杂的信息就可以用多位的二进制数表达。

1bit只能传递两种可能性的信息。信息是多种可能性的一种。例如，我们和别人交谈时，我们说说的每个字都是字典中所有字的一个选择。所有可以被转换成对两种信息或多种可能性的选择的信息，都可以用bit来表示。

利用二进制表示信息饿的一个额外的好处就是我们可以清楚地知道我们是否已经想到所有的可能性。

在二进制中，可能有的编码数等于2的整数次幂，其幂指数就是比特位的位数。

每增加一位，编码的数量就会加一倍。

同样也可以根据编码的数量反推出比特位。比如我们要用二进制表示200种不同的事物，共需要8个比特位。

胶片的曝光速度由美国标准协会（American Standard Association）ASA来制定等级。ASA不仅以十进制数字的形式印在胶卷的外包装和暗盒上，还以比特的形式进行编码。

胶卷共有24个ASA等级，它们是：

要对24个ASA等级进行编码需要5个比特位。

与胶片速度对应的比特值如下表所示。

观察一下相机内部放胶卷的地方，就会发现胶卷筒被内部有6个金属的触点，对应着胶片的金属方格（1——6号）。银色方格实际上是交卷暗盒的金属，即导体；涂有颜料的黑色方格，是绝缘体。

照相机产生的电流流入方格1，方块1通常是银色。这支电流也经过方格2～6上的5个触点，这取决于方格是银色还是黑色。这样，如果照相机在触点4和触点5上检测到电流，而在触点2、3和6上没有检测到。那么这个胶片的速度就是400ASA。这样，照相机就可以据此来调整胶片的曝光时间了。

假设胶片速度是50、100、200或400ASA，那么廉价的照相机就只需读取方格2和方格3上的电流。

也许最常见的二进制的表现形式就是无所不在的通用产品代码（UPC，Universal Product Code），这个小条形码出现在商品的包装上。

在最常见的形式中，UPC是由30条不同宽度的垂直黑色条纹组成的，它们的间隔宽度也不同，条纹下面标有数字。

我们试着将条形码看成是细条和黑条、窄间隔和宽间隔的排列，事实上，这就是观察条形码的一种方式。在UPC中，黑色条纹有四种不同的宽度，宽条纹的高度分别是最细条纹的两倍、三倍或四倍。同样，宽间隔的宽度分别是最窄间隔宽度的两倍、三倍或四倍。

另一种解读UPC的方式就是将它们看作一列比特位。扫描仪看到的UPC断面可以这样表示：

条纹和间隙被读成一行中的一系列比特，每一系列比特可以是1位，2位，3位或4位，而这个位数取决于条纹和间隙的宽度。本例中扫描仪所扫描到的条形码与比特位之间的关系可以简单的表示位：

因此UPC是一串95位二进制数。在本例中，这些比特可以做如下分组。

前3位通常是101，这就是最左边的护线，它帮助计算机扫描仪定位。从护线中，扫描仪可以确定代表单个比特的条和间隔的宽度是多少。

最左边的护线之后是6组比特串，每串含有7个比特位。其中每一组都可以是数字0～9的编码，在后面会有简短的说明。接下来是一个5比特位的中间护线，这是固定的模式，，始终是01010，它是一个内置的检错码。这条中间护线是预防条形码被篡改或被印错的一种方法。

中间护线后面仍然是6组比特串，每组中含有7个比特位。之后是最右边的护线，最右边的护线通常是101.最右边的护线也可以实现UPC的反向扫描，这一点我们将在后面解释。

因此整个UPC对12个数字进行了编码。UPC的左边含有6个编码数字，每个数字占有7个比特位。可以利用如下的表格来解码。

注意，这里每个7位编码都是以0开头，以1结尾的。扫描器可以以此来检测条形码是否正确。另外每组编码都仅有两组连续为1的比特位，这就暗示了每个数字对应着UPC码中的两个垂直条纹。

你也会发现，上表中每组编码都含有奇数个1.这是一种检查错误和一致性的方法陈伟奇偶检验。如果一组比特位含有偶数个1，它就称为偶校验；如果含有奇数个1，那么它就称为奇校验。这样看来，这么编码都拥有奇校验。

破解右边6组7位的编码要用到下表。

可以发现，这些编码都是之前编码的补码，之前出现0的地方，现在都换为1，反之则亦然。这些编码都是以1开头，以0结尾。除此之外，每组编码都是偶校验。

通过上面的解码的表格，我们可以确定条形码所表达的为12个数字：

第一个数字（在这里是0）被称为数字系统符。0意味着这是一个常规的UPC。肉、农产品，这个编码是2，票卷的UPC的第一个数字通常是5.

接下来的5个数字表示制造商编码。在这种情况下，51000就是Campbell公司的编码。后面的5位（01251）是这个公司的某个产品的编码。

最后一个数字（这里是7）称为模校验字符。

一下是转化为比特的结果。

根据6位编码，凸起和不凸起两种情况，所以使用6个bit的二进制比代码来表示。

在本书后面的章节可以看到，bit可以表示文字、声音、图片、音乐、电影，也可以表示产品编码、胶片速度、影评结果。但是从根本商说，bit就是数字。在用bit表示其他信息的时候，我们所要计算的就是计算有多少种可能性。则决定了我们需要的比特位数，以便每种可能性都可以分配到一个编号。

bit在逻辑学中也很重要。逻辑学是哲学和数学的奇特融合，其主要目的就是确定某个陈述是真还是假。真和假同样可以表示为1和0.