如何把网站中一些特定的页面隐藏起来只给搜索引擎蜘蛛爬取
发布网友
发布时间:2022-05-26 00:08
我来回答
共2个回答
热心网友
时间:2023-05-25 17:50
一、蜘蛛爬取原理
大自然的蜘蛛我相信都看到过,它是通过网来进行爬取的。而搜索引擎的蜘蛛是通过链接来爬取的。蜘蛛在网页上爬取到一个链接就会把它放到一个单独的数据库。这些数据库都是有特性的,特性就是域名的后缀。
常用的后缀有.net、.org、.com、.cn、.com.cn等等。
蜘蛛会把这些域名后缀的链接放到一个数据库,然后逐个去爬取,这可能是很多站长朋友的一个误区。蜘蛛是不会像用户一样直接点击进入的,如果那样,那么这个蜘蛛就可以一直在外面不用回家了。因为每个网页都是有链接不断的循环的,爬不完的。
百度反向链接蜘蛛也是会爬取的,有些朋友称之为相关域。百度相关域的意思就是说,只有一个页面被百度收录了,并且这个页面包含你的域名
,这不是一个超链接,但是只有百度收录了我写的这篇文章的页面,那么蜘蛛是会把这个域名列入它的数据库的,然后也会爬取。并且也会计算权重,这就是我们所说的链接诱饵,用来吸引蜘蛛
热心网友
时间:2023-05-25 17:50
这个在页面上不要添加入口,robots文件里设置抓取权限,只能想到这些,希望能帮到您,望采纳~