搜索引擎通过什么来识别我们的网站
发布网友
发布时间:2022-10-10 01:52
我来回答
共4个回答
热心网友
时间:2024-05-28 17:34
一、爬行。
即发现网址链接的过程。
二、抓取存储。
此时搜索引擎的程序会向网站所在服务器提出请求,下载当前网站的整个页面,然后存储到搜索引擎自己的数据存储服务器上。搜索引擎下载处理网页的能力很快,可以同时进行成千上万个。
三、处理。
首先是对它下载下来网站的处理,如提取文字,进行中文分词,去除一些无用内容,以及判断文字内容是否是原创等。
其次是索引,所有处理过的网站最终形成一个关键词和关键词所在位置的集合。如一个网站上有哪些词,这些词出现多少次,在什么地方出现,是否有强调(如加粗等)。
通过以上两个步骤,搜索引擎以关键词的形式来识别你这个网站的内容与哪些主题相关。
四、排名
将存储在搜索引擎自己数据库里的内容与用户搜索词进行匹配,决定最终的排名。
热心网友
时间:2024-05-28 17:35
搜索引擎 有个爬虫,会定期的把互联网上的网页抓取下来。爬的时候会通过URL,也就是网址来抓网页。如果它抓到的网页里面有引用你的,它就会通过这个引用追踪到你。这样就可以爬很多网页了
抓取下来的网页会被它的程序分析,然后从文本,也就是字面上对你的网页有个了解
另外根据别人URL指向你的网页来设置权重
当用户通过关键词查找你网页的时候,会跟你网页的关键词进行一个匹配,再根据一些它自身的权重对搜到的网页排序。这个权重包括很多东西。
热心网友
时间:2024-05-28 17:35
一、爬行
二、抓取存储
三、处理
四、排名
热心网友
时间:2024-05-28 17:36
我们在搜索引擎搜索的内容,是如何被第三方网站知道的?
热心网友
时间:2024-05-28 17:35
一、爬行。
即发现网址链接的过程。
二、抓取存储。
此时搜索引擎的程序会向网站所在服务器提出请求,下载当前网站的整个页面,然后存储到搜索引擎自己的数据存储服务器上。搜索引擎下载处理网页的能力很快,可以同时进行成千上万个。
三、处理。
首先是对它下载下来网站的处理,如提取文字,进行中文分词,去除一些无用内容,以及判断文字内容是否是原创等。
其次是索引,所有处理过的网站最终形成一个关键词和关键词所在位置的集合。如一个网站上有哪些词,这些词出现多少次,在什么地方出现,是否有强调(如加粗等)。
通过以上两个步骤,搜索引擎以关键词的形式来识别你这个网站的内容与哪些主题相关。
四、排名
将存储在搜索引擎自己数据库里的内容与用户搜索词进行匹配,决定最终的排名。
热心网友
时间:2024-05-28 17:35
搜索引擎 有个爬虫,会定期的把互联网上的网页抓取下来。爬的时候会通过URL,也就是网址来抓网页。如果它抓到的网页里面有引用你的,它就会通过这个引用追踪到你。这样就可以爬很多网页了
抓取下来的网页会被它的程序分析,然后从文本,也就是字面上对你的网页有个了解
另外根据别人URL指向你的网页来设置权重
当用户通过关键词查找你网页的时候,会跟你网页的关键词进行一个匹配,再根据一些它自身的权重对搜到的网页排序。这个权重包括很多东西。
热心网友
时间:2024-05-28 17:36
一、爬行
二、抓取存储
三、处理
四、排名
热心网友
时间:2024-05-28 17:36
我们在搜索引擎搜索的内容,是如何被第三方网站知道的?