搜狗官方回答
搜狗对网站的收录量为搜狗爬虫对网站内页面的总成功抓取量。索引量为被收录的页面经过索引流程进入线上后的总网页数量。

搜狗截图20190916153732.png
搜狗对网站的收录量:搜狗爬虫对网站内页面的总成功抓取量。(不要理解为蜘蛛每天的抓取量,意思是:网站从建站以来,搜狗蜘蛛成功抓取到搜狗数据库中网页,这个收录量不是一直增加,也会出现下降、删减的(看网页的质量),还有一点是第一步抓取到数据库中,只是最初级的步骤,属于底层数据库,没什么价值,只是存放数据,还要从底层数据库中筛选出有价值的数据、链接放到高层的数据库中,这一部分放到高层的数据库中的数据,就是索引量了,而放到底层数据库中的数据就是收录量)

这里我们聊一下蜘蛛抓取行为:
1.比如说我新建立了一个网站,我肯定的说我就建立了1000个网页页面;那这1000个网页页面,不可能蜘蛛都抓取到或者说爬到吧,就算有蜘蛛池,谁也不敢说100%都会被爬取
2.假如说我们有800个网页被爬取到了,那这里还有一个疑问,蜘蛛爬取过了800个网页,是不是就一定会带回到搜狗数据库800个网页,我们都知道,蜘蛛有来过我们的网站,但不一定会带走我们网站内容让搜索引擎去分析,它也是有选择型的,它被派过来以后觉得你的内容还不错,就带回去,它觉得你的这个网页的内容不行(不是它需要的,或者它数据库已经有和你80%以上相像的文章内容了,你的这篇文章给它提供不了什么价值),它就是只是来看看,不会带走你的内容,带走的那部分会在让上面的领导面试一下,领导面试通过了,才会放出来的。那这里我们定义一下被带走了500个网页,这500个网页只是被小兵带走的,其中只有100个被领导面试通过了,被放了出来,有了快照!那这里收录和索引的比例就是20%,那这个比例其实是越高越好的,越高证明你的网站整个质量是越好的,属于精品网站

收录量:被带走的这部分链接其实就是我们所说的收录量,它是被存放在底层数据库中的
索引量:领导面试通过的,被放出来的这部分就是我们所说的索引量,也就是我们使用Site语法展现出来的数据量。
当然Site语法是不准确的,相比于其它的各搜索引擎,搜狗的站长后台索引量和前台Site出来的数据差不多是一致的;其它搜索引擎有时候就差别比较大了,我们通常以站长后台索引量为准
百度官方回答:索引量指可以被搜索用户搜索到的网站数据库,索引量工具同时支持站点自定义想要关注的目录,查看某一目录规则下的索引量;索引量不等于流量,索引量会有定期数据波动,属于正常现象。

1000:这一个网站总共网页链接数量
800:被蜘蛛爬取过的网页
500:站长后台收录量.也就是被带走的网页底层数据库数量
100:索引量.搜索引擎site命令出来的数量(site不准确可能低一些,以站长后台索引量为准)

说一下我们平时说的一些口语
1.平时总是听到各个站长互相在问你的网站收录量是多少呀?
这里的我们平时所说的收录量其实就是问的我们网站site的数量,也就是索引量,并不是指站长后台的收录量

2.站长工具和爱站工具中的收录量和索引量指的是什么?
收录量:指的是站长后台的收录量
索引量:指的是站长后台的索引量,也就是Site的数量,也就是具有快照能被用户搜索到的数量
它们的数据我也不知道怎么来的,应该不是很准确,而且更新上也会不及时,我们还是以站长后台为准

3.百度、360、神马站长平台后台有收录量功能吗?
百度、360、神马站长平台是没有提供收录量功能的,只有一个索引量的功能

4.我们平时所讨论的你网站的抓取量是多少?这个指什么?
这里的抓取量其实是指我们网站每天蜘蛛的来访量;抓取量是能直接影响到网站收录的,蜘蛛的抓取量越大,才更有可能网页被带回收录,当然还要看你的网页内容质量
怎么看呢?一个可以通过站长后台的抓取量观看,另一个可以通过网站日志查看

Last modification:September 16th, 2019 at 04:06 pm
如果觉得我的文章对你有用,请随意赞赏