问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

计算机如何显示英文字母和中国字

发布网友 发布时间:2022-04-28 12:26

我来回答

3个回答

热心网友 时间:2023-10-09 03:20

一个汉字占2个字节,一个字节占8位,一个字母占1个字节。计算机中,各种信息都是以二进制编码的形式存在的,不管是文字还是其它各种信息,在计算机中都是以0和1组成的二进制代码表示的,之所以能区别这些信息的不同,是因为它们采用的编码规则不同。英文字母用的是单字节的ASCII码,汉字采用的是双字节的汉字内码
1、字符(英文,包括字母、数字、标点、运算符等)编码
  字符的编码采用国际通用的ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码),每个ASCII码以1个字节(Byte)储存,从0到数字127代表不同的常用符号,例如大写A的ASCII码是65,小写a则是97。由于ASCII码只用了字节的七个位,最高位并不使用,所以后来又将最高的一个位也编入这套编码码中,成为八个位的延伸ASCII(ExtendedASCII)码,这套内码加上了许多外文和表格等特殊符号,成为目前常用的编码。基本的ASCII字符集共有128个字符,其中有96个可打印字符,包括常用的字母、数字、标点符号等,另外还有32个控制字符。标准ASCII码使用7个二进位对字符进行编码,对应的ISO标准为ISO646标准。
  虽然标准ASCII码是7位编码,但由于计算机基本处理单位为字节(1byte = 8bit),所以一般仍以一个字节来存放一个ASCII字符。每一个字节中多余出来的一位(最高位)在计算机内部通常保持为0(在数据传输时可用作奇偶校验位)。由于标准ASCII字符集字符数目有限,在实际应用中往往无法满足要求。为此,国际标准化组织又制定了ISO2022标准,它规定了在保持与ISO646兼容的前提下将ASCII字符集扩充为8位代码的统一方法。ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每种扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均为高位为1的8位代码(即十进制数128~255),称为扩展ASCII码。
2、汉字的编码
(1)汉字内码
  汉字信息在计算机内部也是以二进制方式存放。由于汉字数量多,用一个字节的128种状态不能全部表示出来,因此在1980年我国颁布的《信息交换用汉字编码字符集——基本集》,即国家标准GB2312-80方案中规定用两个字节的十六位二进制表示一个汉字,每个字节都只使用低7位(与ASCII码相同),即有128×128=16384种状态。由于ASCII码的34个控制代码在汉字系统中也要使用,为不致发生冲突,不能作为汉字编码,128除去34只剩94种,所以汉字编码表的大小是94×94=8836,用以表示国标码规定的7445个汉字和图形符号。
  每个汉字或图形符号分别用两位的十进制区码(行码)和两位的十进制位码(列码)表示,不足的地方补0,组合起来就是区位码。把区位码按一定的规则转换成的二进制代码叫做信息交换码(简称国标码)。国标码共有汉字6763个(一级汉字,是最常用的汉字,按汉语拼音字母顺序排列,共3755个;二级汉字,属于次常用汉字,按偏旁部首的笔划顺序排列,共3008个),数字、字母、符号等682个,共7445个。
  由于国标码不能直接存储在计算机内,为方便计算机内部处理和存储汉字,又区别于ASCII码,将国标码中的每个字节在最高位改设为1,这样就形成了在计算机内部用来进行汉字的存储、运算的编码叫机内码(或汉字内码,或内码)。内码既与国标码有简单的对应关系,易于转换,又与ASCII码有明显的区别,且有统一的标准(内码是惟一的)。
(2)汉字外码
  无论是区位码或国标码都不利于输入汉字,为方便汉字的输入而制定的汉字编码,称为汉字输入码。汉字输入码属于外码。不同的输入方法,形成了不同的汉字外码。常见的输入法有以下几类:
  按汉字的排列顺序形成的编码(流水码):如区位码;
  按汉字的读音形成的编码(音码):如全拼、简拼、双拼等;
  按汉字的字形形成的编码(形码):如五笔字型、郑码等;
  按汉字的音、形结合形成的编码(音形码):如自然码、智能ABC。
  输入码在计算机中必须转换成机内码,才能进行存储和处理。
(3)汉字字形码
  为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码(字形码)。全部汉字字码的集合叫汉字字库。汉字库可分为软字库和硬字库。软字库以文件的形式存放在硬盘上,现多用这种方式,硬字库则将字库固化在一个单独的存储芯片中,再和其它必要的器件组成接口卡,插接在计算机上,通常称为汉卡。
  用于显示的字库叫显示字库。显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。已知汉字点阵的大小,可以计算出存储一个汉字所需占用的字节空间。例:用16×16点阵表示一个汉字,就是将每个汉字用16行,每行16个点表示,一个点需要1位二进制代码,16个点需用16位二进制代码(即2个字节),共16行,所以需要16行×2字节/行=32字节,即16×16点阵表示一个汉字,字形码需用32字节。
   即:字节数=点阵行数×点阵列数/8
  用于打印的字库叫打印字库,其中的汉字比显示字库多,而且工作时也不像显示字库需调入内存。
  可以这样理解,为在计算机内表示汉字而统一的编码方式形成汉字编码叫内码(如国标码),内码是惟一的。为方便汉字输入而形成的汉字编码为输入码,属于汉字的外码,输入码因编码方式不同而不同,是多种多样的。为显示和打印输出汉字而形成的汉字编码为字形码,计算机通过汉字内码在字模库中找出汉字的字形码,实现其转换。

热心网友 时间:2023-10-09 03:20

这里以txt文件中的汉字为例, 介绍文本编辑器如何显示汉字的过程:

1. 二进制(文件,你可以把一个文件理解为一串1+0构成的内容.也可以叫落地码编码的内容)——

2. 通过落地码识别出每个字符(落地码,就是utf-8/utf-16/gbk这一类编码, 它们能够将连续的1/0组成的数字串切割(解码过程)成能n个小块(块的长度不一定相同!),每块表示一个字符(一个汉字). 而如何切割, 就是这一类编码的意义所在,具体参考每个编码定义)——

3. 每个小块转成对应的unicode值(unicode也是一种码, 他是用来区分字符和字符之间的唯一性. 即每一个不同的字符的unicode都是不同的. 它一般有固定的长度. 从落地码转成unicode码, 有固定的对应关系,具体参考落地码的编码规范)——

4.  每个unicode值映射到字体库中对应的文字图案()——

5. 读取并显示含有文字的图片

注:

从2开始, 每取下一个块,就可以立即执行345,或者取特定个之后再一起执行345.

英文也可以参照这个过程, 只是比中文更加简单, 比如2的时候,每一个英文字符的块长都是一样的. 

一个文件只能有一种落地码, 并且编辑器需要知道这个落地码是哪一个码. 如果不匹配,就会看到所谓的乱码. 也不是说一定只能一种码...除非你知道你在搞什么..

落地码无处不在. 比如windows系统的默认编码,这个会影响你的粘帖板. 有时候粘帖板中也会包含字体信息.

特别要注意的是, unicode其实也算是一种落地码,只是现在一般用的不多. 当作为落地码时, 格式有ucs-2/ucs-4这两种. 比如windows记事本保存的时候有unicode选项,它默认是ucs-2.

如果有错误的地方忘指出, 谢谢!

附上两个工具:

unicode查询-网页链接

utf8转二进制等-网页链接

热心网友 时间:2023-10-09 03:21

用显示器显示啊

热心网友 时间:2023-10-09 03:20

一个汉字占2个字节,一个字节占8位,一个字母占1个字节。计算机中,各种信息都是以二进制编码的形式存在的,不管是文字还是其它各种信息,在计算机中都是以0和1组成的二进制代码表示的,之所以能区别这些信息的不同,是因为它们采用的编码规则不同。英文字母用的是单字节的ASCII码,汉字采用的是双字节的汉字内码
1、字符(英文,包括字母、数字、标点、运算符等)编码
  字符的编码采用国际通用的ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码),每个ASCII码以1个字节(Byte)储存,从0到数字127代表不同的常用符号,例如大写A的ASCII码是65,小写a则是97。由于ASCII码只用了字节的七个位,最高位并不使用,所以后来又将最高的一个位也编入这套编码码中,成为八个位的延伸ASCII(ExtendedASCII)码,这套内码加上了许多外文和表格等特殊符号,成为目前常用的编码。基本的ASCII字符集共有128个字符,其中有96个可打印字符,包括常用的字母、数字、标点符号等,另外还有32个控制字符。标准ASCII码使用7个二进位对字符进行编码,对应的ISO标准为ISO646标准。
  虽然标准ASCII码是7位编码,但由于计算机基本处理单位为字节(1byte = 8bit),所以一般仍以一个字节来存放一个ASCII字符。每一个字节中多余出来的一位(最高位)在计算机内部通常保持为0(在数据传输时可用作奇偶校验位)。由于标准ASCII字符集字符数目有限,在实际应用中往往无法满足要求。为此,国际标准化组织又制定了ISO2022标准,它规定了在保持与ISO646兼容的前提下将ASCII字符集扩充为8位代码的统一方法。ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每种扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均为高位为1的8位代码(即十进制数128~255),称为扩展ASCII码。
2、汉字的编码
(1)汉字内码
  汉字信息在计算机内部也是以二进制方式存放。由于汉字数量多,用一个字节的128种状态不能全部表示出来,因此在1980年我国颁布的《信息交换用汉字编码字符集——基本集》,即国家标准GB2312-80方案中规定用两个字节的十六位二进制表示一个汉字,每个字节都只使用低7位(与ASCII码相同),即有128×128=16384种状态。由于ASCII码的34个控制代码在汉字系统中也要使用,为不致发生冲突,不能作为汉字编码,128除去34只剩94种,所以汉字编码表的大小是94×94=8836,用以表示国标码规定的7445个汉字和图形符号。
  每个汉字或图形符号分别用两位的十进制区码(行码)和两位的十进制位码(列码)表示,不足的地方补0,组合起来就是区位码。把区位码按一定的规则转换成的二进制代码叫做信息交换码(简称国标码)。国标码共有汉字6763个(一级汉字,是最常用的汉字,按汉语拼音字母顺序排列,共3755个;二级汉字,属于次常用汉字,按偏旁部首的笔划顺序排列,共3008个),数字、字母、符号等682个,共7445个。
  由于国标码不能直接存储在计算机内,为方便计算机内部处理和存储汉字,又区别于ASCII码,将国标码中的每个字节在最高位改设为1,这样就形成了在计算机内部用来进行汉字的存储、运算的编码叫机内码(或汉字内码,或内码)。内码既与国标码有简单的对应关系,易于转换,又与ASCII码有明显的区别,且有统一的标准(内码是惟一的)。
(2)汉字外码
  无论是区位码或国标码都不利于输入汉字,为方便汉字的输入而制定的汉字编码,称为汉字输入码。汉字输入码属于外码。不同的输入方法,形成了不同的汉字外码。常见的输入法有以下几类:
  按汉字的排列顺序形成的编码(流水码):如区位码;
  按汉字的读音形成的编码(音码):如全拼、简拼、双拼等;
  按汉字的字形形成的编码(形码):如五笔字型、郑码等;
  按汉字的音、形结合形成的编码(音形码):如自然码、智能ABC。
  输入码在计算机中必须转换成机内码,才能进行存储和处理。
(3)汉字字形码
  为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码(字形码)。全部汉字字码的集合叫汉字字库。汉字库可分为软字库和硬字库。软字库以文件的形式存放在硬盘上,现多用这种方式,硬字库则将字库固化在一个单独的存储芯片中,再和其它必要的器件组成接口卡,插接在计算机上,通常称为汉卡。
  用于显示的字库叫显示字库。显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。已知汉字点阵的大小,可以计算出存储一个汉字所需占用的字节空间。例:用16×16点阵表示一个汉字,就是将每个汉字用16行,每行16个点表示,一个点需要1位二进制代码,16个点需用16位二进制代码(即2个字节),共16行,所以需要16行×2字节/行=32字节,即16×16点阵表示一个汉字,字形码需用32字节。
   即:字节数=点阵行数×点阵列数/8
  用于打印的字库叫打印字库,其中的汉字比显示字库多,而且工作时也不像显示字库需调入内存。
  可以这样理解,为在计算机内表示汉字而统一的编码方式形成汉字编码叫内码(如国标码),内码是惟一的。为方便汉字输入而形成的汉字编码为输入码,属于汉字的外码,输入码因编码方式不同而不同,是多种多样的。为显示和打印输出汉字而形成的汉字编码为字形码,计算机通过汉字内码在字模库中找出汉字的字形码,实现其转换。

热心网友 时间:2023-10-09 03:20

这里以txt文件中的汉字为例, 介绍文本编辑器如何显示汉字的过程:

1. 二进制(文件,你可以把一个文件理解为一串1+0构成的内容.也可以叫落地码编码的内容)——

2. 通过落地码识别出每个字符(落地码,就是utf-8/utf-16/gbk这一类编码, 它们能够将连续的1/0组成的数字串切割(解码过程)成能n个小块(块的长度不一定相同!),每块表示一个字符(一个汉字). 而如何切割, 就是这一类编码的意义所在,具体参考每个编码定义)——

3. 每个小块转成对应的unicode值(unicode也是一种码, 他是用来区分字符和字符之间的唯一性. 即每一个不同的字符的unicode都是不同的. 它一般有固定的长度. 从落地码转成unicode码, 有固定的对应关系,具体参考落地码的编码规范)——

4.  每个unicode值映射到字体库中对应的文字图案()——

5. 读取并显示含有文字的图片

注:

从2开始, 每取下一个块,就可以立即执行345,或者取特定个之后再一起执行345.

英文也可以参照这个过程, 只是比中文更加简单, 比如2的时候,每一个英文字符的块长都是一样的. 

一个文件只能有一种落地码, 并且编辑器需要知道这个落地码是哪一个码. 如果不匹配,就会看到所谓的乱码. 也不是说一定只能一种码...除非你知道你在搞什么..

落地码无处不在. 比如windows系统的默认编码,这个会影响你的粘帖板. 有时候粘帖板中也会包含字体信息.

特别要注意的是, unicode其实也算是一种落地码,只是现在一般用的不多. 当作为落地码时, 格式有ucs-2/ucs-4这两种. 比如windows记事本保存的时候有unicode选项,它默认是ucs-2.

如果有错误的地方忘指出, 谢谢!

附上两个工具:

unicode查询-网页链接

utf8转二进制等-网页链接

热心网友 时间:2023-10-09 03:21

用显示器显示啊
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
2198香辣虾是什么意思 虾什么梗 肖战 刻纸制作需要哪些步骤 好玩的生存游戏手游(好玩的生存游戏手游推荐) 北京电脑职业培训学校都有哪些北京电脑培训班都有哪些 欧盟商标注册需要提供什么资料? 怎么注册欧盟商标?需要准备哪些材料? 5g手机有什么好处 5g手机大概多少钱 口水臭是什么原因呢? 口水臭是什么原因 口水臭怎么改善 我电脑里的CH中文(中国)没了怎么才能找回来呢 怎么把计算机的系统语言改为中文 这个计算机怎么调中文? 苹果计算机怎么显示中文 如何找到曾经打开的文档 如何在ppt里加入超链接邮件 如何找回刚刚编辑的文档刚刚保存的文档又恢复原样了怎么办 楼梯踏步和扶手的颜色搭配 纯css怎么做质感的按钮 山茶木把件的价格 楼梯材料怎么选 如何搭配楼梯颜色 山茶木的产地在哪 小石积,山茶木是一种吗 黑果木把玩怎么保养 山茶木把玩用上油吗? 几十年的茶树木头适合做手串吗?是采茶叶的茶叶树不是山茶树油茶树。 很重很硬的木头是什么木听别人说是国家一级保护树木,而且不能买卖,只能捐献 谁知道这是什么树啊?在南方地山丘陵地带有零星分布,木制较硬,现在这个时候开白色小花,我们方言叫“何 楼梯踏板用什么材料好楼 梯踏步材料选购技巧都有哪些 山茶木可以吃用吗? 如何洗衬衫不容易皱 衬衫怎么洗才能不褶皱? 怎样从视频里截出清晰的照片 衬衫要怎么洗才不会皱? 怎么洗衬衫不会起皱?? 怎么样洗以及怎么样晾晒才不会让衬衫起皱? 怎么洗衬衫才能不皱 能加法术特效的软件 游戏特效学习那些软件 视频特效的问题:像新白娘子传奇以及西游记之类的视频,其中很多法术的特效特别炫,是怎么做的?什么软件 如何用css,在两个按钮间插入一段空隙 刚才我的iphone11无法进入相机显示黑屏,重启后恢复正常? iphone11手机的摄像头黑屏了打不开怎么办? 提示大家注意卫生间卫生,狠一点的标语 QQ号因被盗风险高被冻结,解冻不了怎么办?(T_T) qq被冻结了按提示操作解冻,但是解冻不了怎么办? qq被自己冻结,解冻不了,又不可以短信验证,该怎么办? 淘宝如何查看已做的评价 确认收费时的评价 要看到星星的 在淘宝评价管理的“给他人评价”页面中只能看到评论,要怎样才能看到星级评价记录? 华为手机没有添加成功的微信好友怎么才能删掉?