java 乱码
发布网友
发布时间:2022-05-02 23:19
我来回答
共1个回答
热心网友
时间:2022-06-28 06:45
这代码有两处会导致乱码, 第一new InputStreamReader
的时候没有指定编码, 因此会使用平台默认字符编码, Windows上, 在javase程序中可能是utf8, 在tomcat里可能是gbk, 下面的content.toString().getBytes()
也一样, 需要手动指定具体编码,
第二 你读取到的网页内容编码未必是utf8的, 不能排除content-type=text/html;gbk的网页, 所以你的编码不应该写死成utf8, 而应该根据获取的网页编码动态设置