搜索引擎通过什么来识别我们的网站

发布网友发布时间：2022-10-10 01:52

共4个回答

热心网友时间：2024-05-28 17:34

一、爬行。
即发现网址链接的过程。
二、抓取存储。
此时搜索引擎的程序会向网站所在服务器提出请求，下载当前网站的整个页面，然后存储到搜索引擎自己的数据存储服务器上。搜索引擎下载处理网页的能力很快，可以同时进行成千上万个。
三、处理。
首先是对它下载下来网站的处理，如提取文字，进行中文分词，去除一些无用内容，以及判断文字内容是否是原创等。
其次是索引，所有处理过的网站最终形成一个关键词和关键词所在位置的集合。如一个网站上有哪些词，这些词出现多少次，在什么地方出现，是否有强调（如加粗等）。
通过以上两个步骤，搜索引擎以关键词的形式来识别你这个网站的内容与哪些主题相关。
四、排名
将存储在搜索引擎自己数据库里的内容与用户搜索词进行匹配，决定最终的排名。

热心网友时间：2024-05-28 17:35

搜索引擎有个爬虫，会定期的把互联网上的网页抓取下来。爬的时候会通过URL，也就是网址来抓网页。如果它抓到的网页里面有引用你的，它就会通过这个引用追踪到你。这样就可以爬很多网页了
抓取下来的网页会被它的程序分析，然后从文本，也就是字面上对你的网页有个了解
另外根据别人URL指向你的网页来设置权重
当用户通过关键词查找你网页的时候，会跟你网页的关键词进行一个匹配，再根据一些它自身的权重对搜到的网页排序。这个权重包括很多东西。

热心网友时间：2024-05-28 17:35

一、爬行
二、抓取存储
三、处理
四、排名

热心网友时间：2024-05-28 17:36

我们在搜索引擎搜索的内容，是如何被第三方网站知道的？

热心网友时间：2024-05-28 17:35

热心网友时间：2024-05-28 17:36

一、爬行
二、抓取存储
三、处理
四、排名

热心网友时间：2024-05-28 17:36

我们在搜索引擎搜索的内容，是如何被第三方网站知道的？