网站的收录由空、网站、内容、抓取量和页面质量决定。 搜索引擎的蜘蛛抓取过程是这样的:首先我们检测网站的Robots.txt文件,确定哪些内容禁止抓取,哪些内容允许抓取,然后进入我们网站的首页,再通过首页的链接抓取到我们网站的内容页面或者栏目页面,再通过栏目页面到达我们的文章页面。 既然知道了搜索引擎抓取我们网站的过程,我们就为你分析一下影响搜索引擎抓取的因素。首先: 1.网站速度的影响 机房问题、dns问题、cdn加速问题、服务器带宽、服务器硬件、操作系统、服务器软件以及服务器上安装的程序可能会影响我们网站的打开速度。 2.nofollow标签的合理使用 Nofollow是一个HTML标记的属性值。这个标签的意思是告诉搜索引擎“不要跟踪这个页面上的链接”或者“不要跟踪这个特定的链接”。那么我们需要做的就是用nofollow筛选掉网站页面的重复链接和对SEO价值不高的页面,减少网站权重的分散,减少搜索引擎反复抓取的网站中每个页面的重复链接,从而提高搜索引擎的抓取效率。 3.网站硬盘问题 如果服务器中安装了多个虚拟机,硬盘的速度会变慢,有时搜索引擎也不会打开网站。 4.返回代码问题 例如,相同的链接返回不同的返回代码,或者404页返回200,等等。 5.安全软件问题 比如开启了防火墙规则、屏蔽了网站端口、开启防采集规则、开启防攻击规则等,导致了搜索引擎同一时间由于大量访问网站,而导致被安全软件拦截。 6.外链问题 我们发送外部链接有两个目的,一是吸引搜索引擎抓取我们的网站,二是提高网站的排名。首先,外链要保证不能简单的指向首页,有些页面会指向专栏页面和张文。 另外,做外链一定要考虑几个因素:多样性、集中性、平衡性、关联性、准确性、高质量、人性化等等。 7.网站的权重 一个网站的权重是搜索引擎对这个网站信任程度的反映。如果网站权重足够高,搜索引擎会及时抓取,反之网站权重低,搜索引擎信任度不高。可能蜘蛛会长时间访问网站一次,对应的爬行频率会很低。 8.网站地图 网站地图最直观地反映了网站到搜索引擎的所有链接,可以提高搜索引擎的抓取效率,为增加网站的收录提供很好的帮助。 9.促进 (责任编辑:admin) |