php远程读取标题编码问题
发布网友
发布时间:2022-12-11 13:35
我来回答
共1个回答
热心网友
时间:2023-09-05 12:04
没法定义,
php不会自动转码,或者http协议里也不会按照你的参数设置自动转码
所以,这需要你自己用代码去转换编码
思路:
1.连接网页读取数据.
2.从header头信息里或者网页代码里获取网页的编码方式(字符集,gbk,utf8等)
3.根据需要把数据转换成你要的字符集
4.解析数据
注:
1.抓数据,若使用file(),file_get_contents()等,网页字符集信息,可从html代码里用正则匹配出来
<meta
http-equiv="Content-Type"
content="text/html;
charset=gb2312"
/>
2.若使用fsockopen()抓数据,
可从http响应头里取的字符集.但响应头里也可能没有字符集信息.最好再结合html头部信息解析下
3.php的正则,建议使用
preg库,
那个功能和性能都更好些