stata16.0导入数据出现中文乱码问题
发布网友
发布时间:2024-10-09 01:51
我来回答
共1个回答
热心网友
时间:2024-10-20 08:55
开始我的毕设之旅,作为一个初学者,我开始学习Stata并开设专栏记录我的学习过程,希望将来能通过之前的文章解决现在的困惑。
我也希望通过这个平台和同样遇到困惑的朋友们交流,希望能提供一些经验和帮助。
我发现Stata的版本兼容性似乎并不理想,以前的数据文件(dta格式)只能适用于较低版本的Stata,当使用较高版本打开时,会出现中文乱码的情况。
据说这是由于Stata从14版本开始使用了Unicode编码。
根据百度百科的解释,“Unicode是计算机科学领域的一项业界标准,包括字符集、编码方案等。Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求”。 简而言之,Unicode使得跨语言交流变得更为方便精准。但这也意味着,Stata 14引入Unicode之后,在Stata文件中使用中文输入的字符就会出现乱码。解决方法也不难,只需进行适当的编码转换(unicode translate)即可,即使用Stata 14提供的unicode系列命令,将中国*通行的国标码(GB18030)转换为一统一码。
因此,乱码问题应该只在Stata 14以前的版本和Stata 14以后的版本之间出现,Stata 15、16、17并没有区别。
然而,Stata官方给出的unicode translate命令并没有什么作用……
Stata官方提供的转码命令,也就是在网上搜索解决Stata中文乱码问题出现最多的回答,就是以下几行代码,其中工作路径和文件名需要替换。
但是这个方法似乎不是很有效。实际运行过程中,会提示文件含有不可转换的符号,无法进行转换。
File not translated because it contains unconvertable characters;
于是我去网上寻找其他的转码方法。找到一个回答:
Stata中文乱码顽疾解决方法-一行命令
其中,这位答主还提醒了要将待转换的数据先备份一份。
我运行这个方法时,Stata报错如下:
encoding not set Before using unicode translate, you must set the character encoding you believe is being used, such as latin1. There are lots of encodings. You set the encoding using the unicode encoding set command. You can set and reset the encoding and repeat the unicode translate command to see which works best. r(198);
因为提示没有设置encoding(虽然其实不懂),我就试了一下加上前面的这行代码。
也就是:
一开始,我使用这个方法对CGSS的数据进行转码,成功了。
后面,我更换了数据源,改成了CLDS数据,再次使用这个方法试图对数据进行转码。
然而不知道为什么,每次跑完之后,也不报错,运行结果看起来没问题,但一两秒之后Stata软件就闪退了。再打开待转换数据,乱码问题并没有解决。
然后我就仔细看了一下这个回答是如何推导出那一行转码命令的。
根据Stata的提示信息,把最后一行改成:unicode retranslate *, invalid。此时,我们附加了invalid选项
这里所说的Stata提示信息就是刚刚说的包含不可转换字符报错,具体为:
我看不懂“run unicode translate with the invalid option.”
根据这位答主的意思,是指在翻译时增加了无效选项?
但反正我试了“unicode retranslate *, invalid”,还是闪退。(其中星号报错,我把星号替换为了文件名。)
现在有两种可能:
1、代码有问题。
2、代码没问题,其他原因导致了Stata闪退。
而我有三种选择:
1、继续寻找其他代码来解决乱码问题,或先尝试解决闪退问题。
2、下载低版本的Stata软件。
3、在咸鱼上购买转码好的数据。
因为时间紧迫,我选择第三种……
所以这篇文章到最后也没解决乱码问题……嗯,写了个寂寞……希望以后Stata水平提高了回来看能解决。
stata16.0导入数据出现中文乱码问题
2、代码没问题,其他原因导致了Stata闪退。而我有三种选择:1、继续寻找其他代码来解决乱码问题,或先尝试解决闪退问题。2、下载低版本的Stata软件。3、在咸鱼上购买转码好的数据。因为时间紧迫,我选择第三种……所以这篇文章到最后也没解决乱码问题……嗯,写了个寂寞……希望以后Stata水平提高了回来看...
Stata outreg2等导出中文乱码的解决方案
Stata中,outreg2、asdoc和esttab等工具用于导出统计和回归结果,但这些工具在处理中文时存在不足,导出的rtf文件中的中文常出现乱码现象。原因是这些工具使用UTF-8编码进行导出,而rtf标准并不支持这种编码。经过一番尝试,我编写了一个小工具,可以将rtf文件的UTF-8编码转换为Word能识别的Unicode编码。使...
Stata14导入CSV数据中文乱码怎么办
在stata页面,手动导入数据:点击文件,导入数据,选择数据格式csv,在下面的编码中选择gbk,然后确定即可。此外,手动点了过后,程序运行界面有相应代码可以查看。
如何解决 Stata 14 的中文乱码问题
JSP页面乱码这种乱码的原因是应为没有在页面里指定使用的字符集编码,解决方法:只要在页面开始地方用下面代码指定字符集编码即可,在页面中使用如下代码:response.setContentType("text/html;charset=gb2312");request.setCharacterEncoding("gb2312");
stata16怎么显示中文啊?
直接在计算机目录中找到stata的主程序并选择进入继续点击Settings跳转就浏览Preferences,这个时候需要按照图示确定显示中文了。Stata是一套提供其使用者数据分析数据管理以及绘制专业图表的完整及整合性统计软件,它拥有很多功能包含线性混合模型,均衡重复反复及多项式普罗比模式用Stata绘制的统计图形相当精美。简介 ...
如何解决Stata14的中文乱码问题
对头,可以转码,之后就不是乱码了。用下面的命令:unicode analyze unicode encoding set gb18030 unicode translate 这三个命令一般情况可以解决你的问题。如果还是不行可试试其它方法。详见help unicode 注意:运行这三个命令前,当前目录需是你欲转换文件所在目录,且内存中不能有stata数据文件。
STATA15—do文档乱码问题
出现如下的问题,屏幕上会显示如图(1)的页面,当真正打开do文档后,面对的是中文乱码的问题,那么这样的问题该怎么处理呢?出现如这样中文乱码情况 总结:具体细节东西可参考连享汇中相关推文,直接打开stata在命令窗口输入lianxh 加上自己要查询问题的关键词,就可直接出结果,很方便。
stata16怎么调成中文
左上角“stata se 16.0” 找到首选”,再找“用户界面语言”调换成chinese就可以了。Stata是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它拥有很多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。简介 新版本的STATA采用最具...
如何解决 Stata 14 的中文乱码问题
转码 乱码 用 面 命令:unicode analyze unicode encoding set gb18030 unicode translate 三 命令 般情况 解决 问题 行 试试其 详见help unicode 注意:运行 三 命令前 前目录需 欲转换文件所 目录 且内存 能 stata数据文件
Stata安装教程详细讲解,免费获取Stata16.0安装包!
1、首先,下载学长提供的压缩包,然后右击解压到“stata16MP_bit”文件夹。2、打开解压后的文件,双击“setupStata16”进行安装。3、点击“Next”进入下一步。4、勾选“接受协议”并点击“Next”。5、姓名和机构可以随意填写英文字符,点击“Next”。6、选择“StataMP”并点击“Next”。7、更改安装路径...