golang爬虫框架colly
发布网友
发布时间:2022-12-27 01:09
我来回答
共1个回答
热心网友
时间:2023-10-18 03:58
colly一款快速优雅的golang爬虫框架,简单易用,功能完备。
官网地址: http://go-colly.org/
包地址: import "github.com/gocolly/colly"
一个简单的例子:
使用方式概括下来主要有三步:
创建采集器时可以指定一些配置参数,如useragent,爬取深度及日志等
回调函数共有7中
通过浏览器开发者工具查看jianshu.com结构如下
文章列表为ul标签,中间每一项是li标签,li中包含content,content中包含title,abstract和meta标签