发布网友 发布时间:2024-08-20 03:33
共1个回答
热心网友 时间:2024-09-10 10:47
Windows XP、Windows7操作系统自带的都是GBK字符集(含2万余汉字),是完全兼容GB2312(仅含0.67万汉字)的。
检查和修改字符集的方法是:
1.【开始】→【运行】→输入cmd
2.【确定】→输入chcp
显示出活动的代码页是936。
3.【开始】→【控制面板】→【日期、时间、语言和区域设置】→【区域和语言选项】
4.【高级】→在代码页转换表中可找到936是简体中文GBK字符集,若不要它的话,可以点击前面小框中的勾,即把勾去掉。
5.继续寻找简体中文GB2312字符集,即代码页是20936,点击前面的小框打上勾。【应用】→【确定】即可。
这样修改后,Windows操作系统自带的就变成GB2312字符集了。
字符集:
字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。中文文字数目大,而且还分为简体中文和繁体中文两种不同书写规则的文字,而计算机最初是按英语单字节字符设计的,因此,对中文字符进行编码,是中文信息交流的技术基础。
GB2312:
1.名称由来:
GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集·基本集》,由原中国国家标准总局发布,1981年5月1日实施。
2.特点:
GB2312是中国国家标准的简体中文字符集。它所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要。在中国大陆和新加坡获广泛使用。
3.包含内容:
GB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。其中包括6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。
4.技术特征:
(1)分区表示:
GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。
各区包含的字符如下:01-09区为特殊符号;16-55区为一级汉字,按拼音排序;56-87区为二级汉字,按部首/笔画排序;10-15区及88-94区则未有编码。
(2)双字节表示
两个字节中前面的字节为第一字节,后面的字节为第二字节。习惯上称第一字节为“高字节” ,而称第二字节为“低字节”。
“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。