网站建设
当前位置:首页 > 新闻中心 > 网站建设 >
为何网站不被收录?网站快照真的和网站息息相关?
发布日期:2020-05-06 阅读次数:138次

一直以来快照都被朋友们视为网站运营的晴雨表,快照出现问题了,那么我们的网站十有八九也要跟着遭殃。正是这种思维导致很多站长心中对于快照总有一些情愫,其实事情并不都是绝对的,起初我也是对快照十分在意,以为快照变了网站就会出现问题,可是后来运营时间长了就会发现,快照并不是什么精准的预兆,很多时候快照的变化还是有其他原因的。下面我针对自己运营网站过程中出现的问题和大家说明下。

快照更新频率的变化会影响网站关键词排名吗?

我想这是大家最为关心的话题,因为大家在运营网站的过程中时常会遇到快照不更新,或是更新变慢的情况。巧合的是有些时候快照更新变慢和网站被K或者是降权相重合,但是这两种有关联吗?从百度官方的说明我们能看到:

每个被收录的网页,在百度上都存有一个纯文本的备份,称为百度快照,这就说明快照本身和我们的关键词排名没有任何关系,快照最大的作用是给与打开速度慢的网站一个缓冲地带,便于蜘蛛的缩阴和用户体验,事实上快照更新的快慢与你内容的质量和更新频率有关系,内容补充高效、有点击率、原创度高,快照更新自然变快,因为这在蜘蛛眼里是良好的信息源,如若你没有达到上述水准,快照变慢理所应当,所以大家还是要理性对待上述情况。

快照回档和网站被拔毛有关联吗?

相比于快照更新快慢不同的是,一旦网站的快照回档总是让大家感觉到不安。因为按照操作经验来看,快照回档基本上就意味着网站要被K,关键词要掉。但这种情况会一定发生吗?显然不是,快照就像前面所说,是一种预留页面便于蜘蛛索引,而且重要的网页一般情况下会在数据库中保留多份数据,但是它们彼此之间的时间是不同的,如果你的快照回档了很有可能是百度自身数据库更新不同步造成的,且很有可能出现在百度更新之后的第二天,因此当你遇到这种情况的时候,没有必要过分沮丧,只要你是正规站点,合理运营,做好优化,快照回档并不一定会造成网站被K等后果,当然如果你的站点是非常规网站,那么网站的快照回档就很有可能是被K了,但是这种原理与常规战快照回档不同,前者是百度更新删除,后者只是更新不同步而已。

点击快照不显示主页,代表什么?

不知道大家遇到过这种诡异的情况吗,就是当你点击爱站数据中自己快照那一栏,打开的页面并不是自己的主页,而是一个内页,碰到这种情况是不是就说明网站要出问题。笔者自己针对这个问题也请教过很多人,大家对于问题可能带来的K站并不确定的,但是一旦出现这种情况,至少预示着两个问题,一是网站原创力度不够,价值不高,首页和采集页一同被屏蔽了,二是站点空间或许存在问题,不稳定,导致蜘蛛爬行的时候没有正常所引导内容,因此即便这个问题无法说明网站一定要被K,但是大家还是要引起注意,检查下自己网站的状态为好。

内页快照的不同变化情况各自代表什么意义?

对于这点一般分为两种情况:

其一,首页不收录,只有内页,对于这种情况的产生多数出自自身问题上,比如站点是新开的,蜘蛛要先观察一段时间,先让你进入沙盒考察,如果你的站点不稳定,那么首页收录就会受到持续影响,快照放出来也会更慢,一旦出现这种情况大家还是谨慎点好,毕竟首页快照长时间不显示会被蜘蛛判定为垃圾页面,影响后期的权重。

其二,首页没问题,但是内页收录少。这种情况其实和第一种类似,主要是网站的内容建设和外链建设不协调造成的,目前来说解决的方法还是比较简单,就是大家可以适当给自己的内页做一些高质量链接就可以了。

网站优化过程中收录一直是一个不管是菜鸟还是老鸟都非常揪心的问题,收录尽管与网站排名没有直接关系,但是排名与收录的的关系总所周知,随着百度算法的不断更新,百度对于收录的准则也越来越高,如何做好收录成了不管是站长还是企业都非常关心的一个问题,接下来就来谈谈网站为什么不收录的问题。

一、是否知道这个页面的存在

对页面进行收录当然首先就必须要知道有这个页面,蜘蛛都不知道这个页面,谈何收录?这一点主要分为2大类:搜索引擎找不到网页入口和不让搜索引擎抓取。

1.搜索引擎找不到网页入口

很多时候不是你更新了文章搜索引擎就要来抓取收录的,要怎么让蜘蛛知道你的更新呢?除了有规律的更新,可以向百度站长平台主动提交URL或者是提交站点地图,也可以让搜索引擎被动收集,这就是通过外链让蜘蛛知道你的网页,还有很多时候蜘蛛来到了你的网站,却找不到你更新的链接,因为网站的链接结构做得太复杂或是内链结构差,以致搜索引擎在抓取时间类不会爬到网站深处的页面,这也造成蜘蛛不知道该页面的存在。所以不管怎么样,第一步我们要保证页面能被蜘蛛看到,关于这一点可以通过查看网站日志来判断蜘蛛是否来访过。

2.不让搜索引擎抓取

很多网站有意无意的直接在robots文件屏蔽了百度或网站部分页面,却整天在找原因为什么蜘蛛不来抓取我的页面,这能怪百度吗?你都不让别人进门了,百度是怎么收录你的网页?所以有必要时常去检查一下网站robots文件是否正常。

二、是否可以正常的抓取

好了,蜘蛛发现了这个页面,也有权利抓取这个页面了,那能否正常抓取就是一个很大的问题,我们都知道蜘蛛抓取这个页面要从域名到DNS服务器再到网站空间,所以其中任何一个环节出现问题,蜘蛛都不能正常的抓取,首先域名需要备案,然后域名解析要正常,如果解析出现问题,域名是不能访问网站ip地址的,这个时候网站打不开,蜘蛛抓取不了页面。

在有就是经常提到的空间服务器了,服务器长期打不开那肯定是抓取不了的,这个大家都知道。并且如果服务器比较卡或者不稳定,就会影响蜘蛛的抓取,蜘蛛不能很好的去抓取页面或由于加载慢只抓取到网页一半,这就很大程度上影响了网站的收录。

三、是否达到收录标准

很多人觉得蜘蛛抓取就代表着收录,其实这是错误的,蜘蛛访问网站抓取页面并不代表就要收录你的网页,页面被抓取后要进行对比筛选,符合要求的才会被收录,为什么有的页面会被收录后又被吐出来?就是因为蜘蛛在不停的过滤,这个我们先不谈。既然是符合要求才会收录,那收录标准到底是什么呢?

1.行业不同标准也不同

这个是显而易见的,新闻类网站肯定比一般企业站容易收录,而对于医疗、博彩、成人用品等网站,标准肯定是更加严格,所以对于不同的行业,百度给予的收录标准也是不一样的。

2.不同的网站标准不同

百度有一个优先抓取的原则,对于绝大多数用户喜欢,权重高的网站收录得要快,就像新浪网、腾讯网收录得肯定要比一般网站要快,为什么?因为信任,这类网站本身就有其严格的过滤系统,在此类网站公布的内容百度基本是直接抓了就收,搜索引擎是互联网与用户的桥梁,它的目的就是给用户提供有价值的内容,你能为它提供良好的内容,它当然也会对你更好,这是互利的。所以搜索引擎不是做慈善,你的网站能给它什么?

3.主体收录标准

百度有一个收录标准值,对页面进行评分,满足评分收录,否则扔掉。主要是从页面基础、站内、站外、用户四个方面进行评分,感兴趣的可以看一看,这里就简单谈一谈网站页面的内容,

(1)页面字数建议是在500-800字,内容健康良好,信息丰富;

(2)受众多:文章要有一定得用户需求,也即用户检索需求的大小;

(3)时效性:写最新的东西用户和搜索引擎都喜欢

(4)稀缺性:稀缺主要是描述页面在互联网中的独特性。稀缺不等于无重复,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。 

四、是否有干净的域名

刚说了百度的收录标准,其实这一点也属于一个特别的标准,域名不干净同样是影响网站收录的一个重要原因,这个不干净我们分为2种情况。第一种就是域名在购买之前就有人用过了,不仅使用了而且还是用废了,这样的域名背景就是不干净,这就相当于以前如果你去考警察,如果家里是黑帮世家,那肯定是会影响你的,这和百度的收录是一个道理,严重的甚至域名直接作废。

另一种情况是我们经常说的降权,网站被降权这段时间是百度的一个审核期,网站的内容就算满足了上面所说的3点也可能收录慢或者是不收录,这个就需要我们坚持了。有恒心,能再次获得百度的信赖就会收录正常。

五、是否达到收录最大限度


等级不同的网站总收录的最大限度不同,日收录限制也不同。在新浪上更新1万篇文章可能会收录90%,但是如果在你的企业站更新1w篇文章可能是只会收录几十篇。这就是因为新浪的等级比你的高。等级不等于权重,权重只是等级的一个部分,等级是网站的重要程度,就像我们一个网站中不同页面的重要程度不一样,而在整个互联网不同网站的重要程度也不一样。所以中小型网站不要为了有大量的收录不断的去大量更新文章,这样的做法是错误的。不同的行业的更新的频率和数量是不一样,娱乐新闻行业可能需要几分钟更新一次,但是小型企业站可以几天或者几周更新一次都没有关系。

同时不同网站总收录最大限度也不一样,一个中小型新站目前的权重是1或者没有权重,那么它的收录限制维持在几十、几百到一千的数量。如果你发现不管你怎么更新做原创高质量的内容收录也上不去,可能就是因为网站权重处于一个阶段达到了收录限制,所以收录不可能上去。就好比家里的猫长得再大食量也没有猪多,所以猪分配的食物就自然要比猫多了,如果网站要突破这个收录的限制就要在权重上上升一个等级。

好了,就写到这了,我们不建议刻意的去提升收录,因为收录不等于排名,收录也不会直接影响到网站排名,网站根据行业需求和用户需求有规律的更新就可以了,用户在进入你的网站之后不需要再进入其它网站补脑了,这说明你的网站内容满足了用户所有的需求。