数据编码详细资料大全
发布网友
发布时间:2023-04-30 17:01
我来回答
共1个回答
热心网友
时间:2023-10-09 14:12
为了便于使用,容易记忆,常常要对计算机加工处理的对象进行编码,用一个编码符合代表一条信息或一串数据,这就是数据编码。几种常用的编码方案有:单极性码、极性码、双极性码、归零码、双相码、不归零码、曼彻斯特编码、差分曼彻斯特编码、多电平编码、4B/5B编码等。
基本介绍
中文名 :数据编码 外文名 :Data code 套用 :计算机网路传输、光纤传输 目的 :便于使用,容易记忆 优点 :节省存储空间,提高处理速度 套用学科 :计算机科学、通信工程、电子科学
简介,编码要求,目的,编码的结构类型,顺序编码,分类编码,常见编码方案,单极性码,极性码,双极性码,归零码,双相码,非归零电平编码,非归零反相编码,曼彻斯*,差分曼彻斯*,多电平编码:,4B/5B编码,
简介
数据编码是计算机处理的关键。不同的信息记录应当采用不同的编码,一个码点可以代表一条信息记录。由于计算机要处理的数据信息十分庞杂,有些资料库所代表的含义又使人难以记忆。为了便于使用,容易记忆,常常要对加工处理的对象进行编码,用一个编码符合代表一条信息或一串数据。对数据进行编码在计算机的管理中非常重要,可以方便地进行信息分类、校核、合计、检索等操作。人们可以利用编码来识别每一个记录,区别处理方法,进行分类和校核,从而克服项目参差不齐的缺点,节省存储空间,提高处理速度。
编码要求
在进行数据编码时应遵循系统性、标准性、实用性、扩充性和效率性。 数据编码数据通过编码可建立数据间的内在联系,便于计算机识别和管理。地理信息系统中主要的数据编码是服务于空间信息分析的地理编码。即为识别图形点、线、面或格网位置及属性而建立的编码方法,包括拓扑编码和坐标编码。前者是表示空间数据位置相邻逻辑关系的编码方法;后者是表示空间数据位置在某一坐标系统下的量度,可以是隐式的(对格网数据)或显式的。
目的
编码的主要目的是减少信息量,因为数据影响处理效率和精度,效率低主要是由于大量字元用于名称或描述,许多时间用于报告、录入、辨认及理解。更重要的是必须有足够空间存放那些字元及数字。这种低效率对手工操作及计算机处理都有很大影响。另一方面,要提高计算机处理精度,必须实现数据项定义标准化。设计好的编码结构可以解决上述问题。例如一个三位数编码000-999,唯一并简洁标识1000个不同条目,明显比每一条用语言描述占用空间少。 运用编码除提高处理效率及精度之外,编码结构可用表示特定意思。例如一个人的身份证号码可以表示所在省市区、出生年月、性别等。关于这个人的数据就可以根据规定算法,用计算机进行排序、总结、统计、分析等。 编码在离线批处理及线上查询系统中都是必要的,编码的结构可能非常复杂,但它对实现现代化的信息处理系统是非常重要。
编码的结构类型
编码可以用许多方法,选择适当的编码结构是非常重要的,经常使用的是以下几种编码结构。
顺序编码
顺序中每一项代表一个信息,它的可能结构表示如下: 001 王林 002 张三 003 李四 ..... 500 李明 顺序编码方案的优点: 1、这是一个最经常使用的结构,因为它简单; 2、短而且单一; 3、当查询者知道编码时,查找比较方便,只要找到编码出现的地方即可; 4、管理简单方便 顺序编码方案的缺点:它无逻辑基础,除了在列表中顺序外,不包括其他有用信息;"不具有容错性,每次修改只能在最后一个记录。
分类编码
分类编码可能出现的情况与身份证号码差不多,分类编码就是将一个数据块分成若干个表示特定意义的小数据块组成,这些小的数据块必须能表示所有数据。 分类编码的优点: 1、数据的值和位置表示特定含义; 2、分类编码结构对于信息处理比较方便,每个小数据块均能方便地检索、操作、分析、排顺序等; 3、数据块类别扩展起来比较方便,除非这项数已达到最大容量; 4、分类数据块可以在编码结构中添加或删除。 分类编码的缺点:编码长度由性质分类来决定,使得编码位数偏多;许多情况下,编码都有空闲;需要修改时,可能带来系统维护的问题。
常见编码方案
常见的数据编码方案有:单极性码、极性码、双极性码、归零码、双相码、不归零码、曼彻斯特编码、差分曼彻斯特编码、多电平编码、4B/5B编码。
单极性码
在这种编码方案中,只适用正的(或负的)电压表示数据。单极性码用在电传打字机接口以及PC机和TTY兼容的接口中,这种代码需要单独的时钟信号配合定时,否则当传送一长串0或1时,传送机和接收机的时钟将无法定时,单极性码的抗噪声特性也不好。
极性码
在这种编码中,分别用正和负电压表示二进制数“0”和“1”。这种代码的电平差比单极码大,因而抗干扰特性好,但仍需另外的时钟信号。
双极性码
信号在三个电平(正、负、零)之间变化。一种典型的双极性码就是信号反转交替编码(AMI)。在AMI信号中,数据流遇到“1”时使电平在正和负之间交替翻转,而遇到“0”时则保持零电平。
归零码
归零码(Return to Zero,RZ),即码元中间信号回归到零电平,比如从正电平到零电平的转换表示码元“0”,而从负电平到零电平表示码元“1”。
双相码
双相码要求每一位中都要有一个电平转换。因而这种代码的最大优点是自定时,同时双相码也有检测错误的功能,如果某一位中间缺少了电平翻转,则被认为是违例代码。
非归零电平编码
非归零电平编码(Non-Return to Zero Level,NRZ-L),即不使用0电平,用正电平表示“1”,负电平表示“0”。
非归零反相编码
非归零反相编码(Non-Return to Zero Inverted,NRZ-I),即当“1”出现时电平翻转,当“0”出现时电平不翻转。这种代码也叫差分码。
曼彻斯*
曼彻斯*(Manchester),高电平到低电平的转换边表示"0",低电平到高电平的转换边表示"1",位中间的电平转换边既表示数据代码,也作定时信号使用。曼彻斯特编码用在乙太网中。
差分曼彻斯*
差分曼彻斯*(Differential Manchester),也叫做相位编码(PE);常用于区域网路传输。在曼彻斯特编码中,每一位的中间有一跳变,“0”表示位的开头有跳变,“1”表示位的开头没有跳变,位中间的跳变既作时钟信号,又作数据信号。
多电平编码:
码元可取多个电平之一,每个码元可代表几个二进制位。
4B/5B编码
这是兆位快速乙太网的光纤分散式数据接口(FDDI,Fiber Distributed Data Interface)中采用的信息编码方案。这种编码的特点是将欲传送的数据流每4bit作为一个组,每四位二进制代码由5位编码表示,这5位编码称为编码组(code group),并且由NRZI方式传输。