真正的搜索引擎通常是指在互联网上收集数千万到数十亿的网页,对网页中的每个单词(即关键词)进行索引,并建立索引数据库的全文搜索引擎。当用户搜索关键字时,页面内容中包含该关键字的所有网页都将作为搜索结果被搜索出来。经过复杂的算法排序后,这些结果将根据与搜索关键字的相关程度按顺序排列。 一、搜索引擎工作的基本原则 1.首先建立网站,填写内容,爬蜘蛛,识别,最后收录。 2.页面收集-蜘蛛爬行-第一轮计算-包含-第二轮计算(排名)-最后排序 3、在搜索引擎上,放上一篇文章,我们可以这么理解,蜘蛛它会帮你归纳到一个相关内容中进行匹配与排名,搜索引擎蜘蛛发觉你的文章网站中内容与其他网站不一样,用户浏览网站体验久,会给网站得分给予排名。 第二,Baiduspider按照上面网站设置的协议抓取站点页面,但是不可能平等对待所有站点。它会综合考虑站点的实际情况来确定一个抓取配额,每天对站点内容进行量化抓取,也就是我们常说的抓取频率。那么百度搜索引擎根据什么指标来确定一个网站的抓取频率呢?有四个主要指标: 1、网站更新频率:更新更快,更新更慢,直接影响Baiduspider的访问频率 2.网站更新质量:更新频率增加,只吸引了Baiduspider的注意力。Baiduspider对质量要求严格。如果百度蜘蛛每天更新的大量内容被判定为低质量页面,那还是没有意义的。 3.连接性:网站要安全稳定,对Baiduspider保持开放。让拜杜斯皮德闭嘴不是好事。 4、站点评价:百度搜索引擎会对每个站点都有一个评价,这个评价会根据站点情况不断变化,这是百度搜索引擎对站点的一个基本评分(绝不是外界所说的百度权重),是百度内部非常机密的数据。网站评级从来不是独立使用的,会和其他因素、阈值一起影响网站的抓取和排名。 概念:搜索引擎只能搜索存储在其网络索引数据库中的内容。你也要有这个概念:如果你在搜索引擎的web索引数据库里没有找到,那就是你的能力问题,学习搜索技巧可以大大提高你的搜索能力。 (责任编辑:admin) |