ASCII编码和汉字编码有什么关系。
发布网友
发布时间:2022-04-21 17:45
我来回答
共3个回答
热心网友
时间:2023-01-27 16:11
每个键盘上的键值及字符 在ASC码中都有一个对应,而每个汉字由2个ASC码对应。首字节高位是1的,可能是汉字编码,或者反过来说,汉字编码两个字节的高位为1。ASCII高位为0。
汉字编码范围(GB2312),第一字节 第二字节,0xB0-0xF7(176-247) 0xA0-0xFE(160-254)
ascll码范围 0-127,可以看出对于汉字,无论第一个字节还是第二个字节,第一位都是1而ascll码的第一位是0。
热心网友
时间:2023-01-27 17:29
一、ASCII码1、什么叫ASCII码?计算机中用二进制数表示字母、数字、符号以及控制符号,目前主要用ASCII码(美国标准信息交换码的缩写)。1)常用字符有128个,编码从0到127。2)控制字符:0~31、127,共33个,不可显示;3)普通字符:95个,包括10个阿拉伯数字、52个英文大小写字母、33个运算符。4)每个字符占一个字节,7位,最高位为0。
常见ASCII码的大小规则,0-9<A-Z<a-z: 1)数字比字母要小。如
“7”<“F” 2)数字0比数字9要小,并按0到9顺序递增。如
“3”<“8” 3)字母A比字母Z要小,并按A到Z顺序递增。如“A”<“Z” 4)同个字母的大写字母比小写字母要小32。如“A”<“a” 记住几个常见字母的ASCII码大小: “A”为65;“a”为97;“0”为48; 2、ASCII码表如下:字符范围十六进制十进制空格20H320~930H~39H48~57A~Z41H~5AH65~90a~z61H~7AH97~122二、汉字编码1、汉字编码分类汉字在不同的处理阶段有不同的编码。(1)汉字的输入:输入码(2)汉字的机内表示:机内码(3)汉字的输出:字形码(字库
Font)
输入码
国标码
机内码
输出码
各种编码之间的关系:
2、汉字的机内表示:机内码计算机在信息处理时表示汉字的编码,称作机内码。现在我国都用国标码(GB2312)作为机内码,GB2312-80规定了:(1)一个汉字由两个字节组成,为了与ASCII码区别,最高位均为“1”。(2)汉字6763个:一级汉字3755个,按汉字拼音字母顺序排列;二级汉字3008个,按部首笔画汉字排列。(3)汉字分区:94行(区),94列(位)(区位码)
3、汉字的输入:汉字输入码(1)数字码(或流水码)如:电报码、区位码、纵横码优点:无重码,不仅能对汉字编码,还能对各种字母、数字符号进行编码。缺点:是人为规定的编码,属于无理码,只能作为专业人员使用。(2)字音码如:全拼、双拼、微软拼音优点:简单易学。缺点:汉字同音多,所以重码很多,输入汉字时要选字。(3)字形码如:五笔字型、表形码、大众码、四角码优点:见字识码,一般重码率较低,经强化训练后可实现盲打。
缺点:拆字法没有统一的国家标准,拆字难,编码规则繁,记忆量大。(4)音形码如:声形、自然码、钱码
优点:利用音码的易学性和形码可有效减少重码。缺点:既要考虑字音,又要考虑字形,比较麻烦。4、汉字的输出:字形码(字库
Font)(1)点阵字形A)16?16、24×24、48×48B)每一个点在存储器中用一个二进制位(bit)存储,所以一个16×16点阵汉字需要32(16×16/8=32)个字节存储空间。(2)轮廓字形把汉字笔画的轮廓用一组直线和曲线勾画,记录的是这些几何形状之间的关系,精度高,Windows的TrueType字库采用此法。5、区位码、国标码与机内码的转换关系方法(1)区位码先转换成十六进制数表示(2)(区位码的十六进制表示)+2020H=国标码;(3)国标码+8080H=机内码举例:以汉字“大”为例,“大”字的区内码为2083解:1、区号为20,位号为832、将区20,位号83分别转换为十六进制表示为1453H3、1453H+2020H=3473H,得到国标码3473H4、3473H+8080H=B4F3H,得到机内码为B4F3H来源:◆网界网论坛◆
热心网友
时间:2023-01-27 19:04
ascii码:美国(国家)信息交换标准(代)码,一种使用7个或8个二进制位进行编码的方案,最多可以给256个字符(包括字母、数字、标点符号、控制字符及其他符号)分配(或指定)数值。
ascii码于1968年提出,用于在不同计算机硬件和软件系统中实现数据传输标准化,在大多数的小型机和全部的个人计算机都使用此码。ascii码划分为两个集合:128个字符的标准ascii码和128个字符的扩充ascii码。
每个汉字有个二进制编码,叫汉字国标码。
在我国汉字代码标准gb2312-80中有6763个常用汉字规定了二进制编码。
每个汉字使用2个字节。
gb2312-80
gb2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(2oh),因此也称为区位码。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。gb2312将收录的汉字分成两级:第一级是常用汉字计
3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而
gb2312最多能表示6763个汉字。