问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

为什么用querylist采集数据采集到缺少

发布网友 发布时间:2022-04-07 10:33

我来回答

2个回答

懂视网 时间:2022-04-07 14:54

QueryList使用jQuery的方式来做采集,拥有丰富的插件。

下面来演示QueryList使用Baidu搜索引擎插件轻松实现站内搜索。

安装

使用Composer安装:

安装QueryList

composer require jaeger/querylist

GitHub: https://github.com/jae-jae/Qu...

安装Baidu搜索引擎插件

composer require jaeger/querylist-rule-baidu

GitHub: https://github.com/jae-jae/Qu...

插件API

● Baidu baidu($pageNumber = 10):获取百度搜索引擎

class Baidu:

● Baidu search($keyword):设置搜索关键词

● Baidu setHttpOpt(array $httpOpt = []):设置HTTP选项,查看: GuzzleHttp options

● int getCount():获取搜索结果总条数

● int getCountPage():获取搜索结果总页数

● Collection page($page = 1,$realURL = false):获取搜索结果

使用

实现一个百度网盘资源搜索引擎:

<?php
require 'vendor/autoload.php';
use QLQueryList;
use QLExtBaidu;
$ql = QueryList::use(Baidu::class);
// 搜索百度网盘网站,包含‘百度’关键词的资源
$searcher = $ql->baidu()->search('site:pan.baidu.com 百度');
// 获取第一页数据,并获取真实URL连接地址
$data = $searcher->page(1,true);
print_r($data->all());

抓取结果:

Array
(
 [0] => Array
 (
  [title] => 百度网盘_享你所想
  [link] => http://pan.baidu.com/
 )
 [1] => Array
 (
  [title] => 百度网盘 客户端下载
  [link] => https://pan.baidu.com/download
 )
 [2] => Array
 (
  [title] => 百度网盘-开放平台
  [link] => https://pan.baidu.com/platform/read
 )
 // ....
)

更多用法

$baidu = $ql->baidu(15); // 设置每页搜索15条结果
$searcher = $baidu->search('QueryList');
$count = $searcher->getCount(); // 获取搜索结果总条数
$data = $searcher->page(1);
$data = $searcher->page(2);
$searcher = $baidu->search('php');
$countPage = $searcher->getCountPage(); // 获取搜索结果总页数
for ($page = 1; $page <= $countPage; $page++)
{
 $data = $searcher->page($page);
}
$data = $searcher->setHttpOpt([
 // 设置http代理
 'proxy' => 'http://222.141.11.17:8118',
 // Set the timeout time in seconds
 'timeout' => 30,
])->page(1);

Google搜索引擎插件

当然除了Baidu搜索引擎插件,QueryList也有Google搜索引擎插件,也可以实现同样的功能。

GitHub: https://github.com/jae-jae/Qu...

更多PHP相关知识,请访问PHP中文网!

热心网友 时间:2022-04-07 12:02

QueryList是一个基于phpQuery的PHP通用列表采集类,得益于phpQuery,让使用QueryList几乎没有任何学习成本,只要会CSS3选择器就可以轻松使用QueryList了,它让PHP做采集像jQuery选择元素一样简单。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
15份的摘抄,要短的我是写作业的,差不多一份要一张纸 肯定会给高分_百度... 补牙前怎么样杀神经? ...我妈让我把牙堵上,想知道是怎么堵?要是杀神经,具体流程是什么样的... 汽车电瓶断电开关断正极还是负极 汽车电瓶断电开关断正极吗 为什么汽车电瓶断电后要断开负极 亳州市教师资格证考哪些科目 请问在观澜坐哪路公交车去深圳大学 陈旧隙腔性脑梗塞能喝酒吗?要喝的话多少为好?谢谢……! 男女朋友分手,怎样消除房产证上女方的名字 ...加了女方的名字 现在女方要提出分手 这房子该怎么处理? 玻璃水上冻了怎么办? 一个手机能申请几个支付宝? 一个手机号注册了几个支付宝,会不会被封号 为什么S8不支持触摸灵敏度调节 而S9就支持? 三星s8+,触屏老是安不住,比如腾讯qq和微信的语音说话老是按键不住,这是什么问题 s8+手机屏幕七分之一上方触摸不灵了 怎么办 三星s8更换屏后为什么开机后一会儿触摸屏就不管用了,重启后不长时间又不行了? 母亲节作文300字―400字。怎么写作文? 特别的母亲节作文选45o字 和平精英两个怎么随时免密切换? 母亲节的文章400字 我的母亲作文400字 我的母亲的作文 400字 以母亲节为题目写一篇作文(400字) 歌颂母亲征文400字 《母亲节》作文400字,怎么写 吃鸡游戏两个怎么切换? 关于母爱为题目的作文400字 母亲节400字作文 暗影精灵6plus要下载nvidia吗 杨梅酒十大好处 我想查查自己的通话记录 余额宝收款码在哪里面 美团支付的时候自动开通了支付宝 重阳节是纪念谁的? 夏天喝杨梅酒有什么好处 重阳节主要纪念什么? 重阳节有什么纪念意义 重阳节为什么叫重阳有什么历史意义 这个节日为什么值得纪念。 英雄杀怎么升级? 英雄杀手游升到15级都很慢 英雄杀等级怎么升的? 英雄杀怎么快速升级 英雄杀怎么快速升级? 我是NVIDIA GO7400显卡怎么设置电脑与电视分屏 英雄杀升级最快方法 《英雄杀》如何升级最快? NVIDIA GeForce 210 显卡如何带两个显示器 英雄杀如何升级最快 英伟达显卡如何设置双屏显示?怎么操作