php模拟登陆抓取数据,无法用正则表达式匹配中文
发布网友
发布时间:2022-04-06 10:13
我来回答
共1个回答
热心网友
时间:2022-04-06 11:42
header()函数是输出到HTTP头,和你这个问题是没有关系的。
真正相关的,是你的源代码的编码方式。
我举个例子,若源代码文件是采用UTF8编码,那么你在抓取到页面后,先要进行编码转换到UTF8!
如,使用iconv:
若抓取到的页面存放在$contents中:那么运行$contents=iconv('gb2312','utf-8//IGNORE',$contents);//参数中的IGNORE是忽略错误
这样再进行正则匹配才行。
当然匹配出来的结果也需要用UTF8来正常显示,所以header()那部分就不用去掉了。