SEO数据分析:如何改善网站收录

庆瑞seo博客2年前网站优化401

共计 2198 个字符,预计需要花费 6 分钟才能阅读完成。

注:搜索引擎做为网站流量的重要来源,网站的收录量自然是大部分网站运营人员关心的问题。

 

先明确一些基本点,一个网页被收录与否,有两个因素

是否被爬虫爬过

页面质量是否过关

 

上一篇文章已经提过了收录率这么一个指标,很多网站都懒得去做这个指标,“我看看 site 的数据不就行了!”,事实上没有这个指标,很多工作就无从下手。从数据中找出问题,利用数据指导解决方案,分析数据验证工作成果。最近看了《深入浅出 数据分析》这个本,觉得不错,把数据分析的方法讲得很生动,建议有兴趣的从事数据分析的同学可以买本看看。任何数据分析由,目标 -> 分析 -> 评估 -> 决策,四个环节组成。

目标:我们想看一下网站的收录情况如何,在 seo 方面是否还有提高的机会。

分析:收录情况什么算好什么算坏,是不是用一些指标来衡量?网站的收录情况是不是过于笼统,是不是应该细分下各个页面的收录情况?

评估:于是我们需要下面一些数据

> 网站的页面层级关系

SEO 数据分析:如何改善网站收录

> 各个层级页面带来的 SEO 流量

> 各个层级页面的收录情况如何

SEO 数据分析:如何改善网站收录

SEO 流量的占比可以从 Google Analytics 中过滤出来。

页面数量可以从数据库获得,或者通过火车头 or 自制小脚本抓取统计。

收录率可以将获取的页面通过工具进行搜索,火车头也可以。

 

问题立马凸显!

 

 

1+ 2 级目录页带来了大量的流量,收录率不是很好,优化收录的流量提升突破口在此!

SEO 数据分析:如何改善网站收录

 

产品页面数量很多,收录也不是很理想,但是带来的流量有限,除了收录问题,还有页面内容的问题,本文中先不管它了。

决策:我们的结论是立刻展开行动对目录页面进行收录的优化。

看到这边,似乎刚开始的目标:“通过优化收录提升流量”

演变成了新的目标:“如何提高目录页面的收录量”

这边能不能再次通过数据分析的方法进行 SEO 呢?

答案是肯定的!

我们再来重新走一遍 目标 -> 分析 -> 评估 -> 决策 的过程

目标:提高目录页面的收录量

分析:通过本文开始的有关收录的两个因素,我们需要检查一下,网页是否被爬虫爬行过,网页的质量是不是过关。

1. 关于爬虫的情况,我们需要分析日志,才能确定。于是我们从日志中拆分一系列数据看看页面是否真的被爬行过。

2. 由于页面质量似乎是一个很难衡量的值,于是我们可以用相同模板下的:

已被爬行的页面数量 / 已被爬行并且被收录页面数量

来评估该模板页面质量对收录的影响大小。如果被爬的页面都被收录了,那至少说明这套页面的内容搜索引擎还算认可。(实际情况远比这个复杂,而且收录后也有可能因为质量问题被删除,但总比什么参照都没有要好,对吧!)

评估:(敏感信息用编号代替,均为真实数据)

先看一下爬虫日志的情况,通过 Shell 脚本,我们可以分析出。

目录总计被爬行的次数为 13000 次左右

不重复的目录爬行次数为 5500 次左右

频道 A 下的目录几乎被 100% 抓取过至少 1 次,频道 B 的目录抓取也不错,有 70% 被至少抓过一次。

其余频道下的目录被抓取的覆盖率不到 30%

SEO 数据分析:如何改善网站收录

不要觉得这个结果很神奇,其实很多网站都会面对这样的糟糕问题,只要你把数据不断的细分,细分,再细分,总会观察出一些端倪的。

关于日志分析,不要迷信任何的日志分析软件,那都是给懒人用的,自制脚本 +Excel 才是王道,可以拆分显示出任何你想要的数据,当然,甚至可以连 Excel 都不要。

然后,我们统计了一下被抓得最频繁的频道 A 和频道 B,目录页的收录率

SEO 数据分析:如何改善网站收录

频道 A 和 B 是很让人放心的,说明页面质量没问题,但是余下的收录情况就让人比较担心了。

决策:通过上面的数据评估,我们已经得到了如下结论。

页面质量并不是影响收录的原因。

频道 A,B 的抓取量异常的高,通过调查了解,原来是首页上的目录页,显示的全是频道 A 下的目录页,首页又拥有全站最高的权重。频道 B 拥有比其他频道强大的外链资源,权重也非常高。

除了 A, B 频道,其他频道的抓取情况不容乐观,抓取入口太少,太深,进而影响了收录情况。

很明显,现在频道 A 从站内的角度来说太强大了,必须进行一些“劫富济贫”的运动来降低频道 A 的抓取量,转移到其他频道中去。同时,需要给爬虫提供更多的入口抓取频道页。

现在问题变得清晰起来,我们开始把工作分成两部分:1. 提供更多的入口 2. 将资源平分给各频道而不是集中在少数几个频道上。

提供入口工作:

1. 把目录页的 URL 制作成 sitemap。提交给搜索引擎,并且将其设置为比较高的抓取权重。

2. 完善面包屑导航,将面包屑导航划分得更加细致,以提供更多入口

3. 在其他产品中推荐目录页

资源平分工作:(一些概念:任意页面都有可能成为爬虫入口,百度爬虫抓取深度有限,页面相对入口越浅,被抓取的概率越高。)

1. 原先首页指向的都是频道 A 的目录页 + 产品页,将其全部 nofollow,确保从首页进入的爬虫,全部抓取到频道页,通过频道页再进入目录页(其实这个不算太重要)

2. 原先频道页指向自身的产品页,将其全部 nofollow(确保从频道页入口的爬虫,最大程度的抓取目录页)

3. 从目录页返回到首页的链接,将其全部 nofollow。

4. 减少一些页面上无关链接。(什么情况下这么做都是非常有效的。)

现在可以开始动手了。。

成果

这么做到底有什么效果呢,我们来看看修改后 1 个月后的数据。

SEO 数据分析:如何改善网站收录

目录页的收录率提高了 100%!

产品页的收录率也有一定程度的提高,这是归功于目录页对于产品的良好展现。

目录页的 SEO 表现:

SEO 流量占比上升了 15%

增长 10% 的到访关键词数量(新页面的收录)

SEO 流量增长了 50% 以上。(包含一些季节因素)

备案号:豫ICP备19030587号

相关文章

SEO数据在SEO中如何体现

SEO数据在SEO中如何体现

共计 374 个字符,预计需要花费 1 分钟才能阅读完成。 做 seo 的朋友们都知道要有耐心,要有恒心。只是没从更深的数据角度去谈 SEO 为什么要有耐心,要有恒心。现在我就来从数据角度来分析...

如何为产品写推广软文?

如何为产品写推广软文?

共计 621 个字符,预计需要花费 2 分钟才能阅读完成。 推广软文 与普通的广告文区别在于“软”字,即非硬性推广,通过文章内容将读者代入一个笔者精心设计的“广告陷阱”,并接收文章中对产品的推...

手机淘宝SEO实战

手机淘宝SEO实战

共计 2485 个字符,预计需要花费 7 分钟才能阅读完成。 提升淘宝店铺流量是一个既简单又不简单的事情。有的卖家或许会觉得,要提升流量,只要做好淘宝 seo 就可以了。然而,仅仅靠这个是不够的...

营销型网站关键字优化必须依照哪些标准去实行更有效率?

营销型网站关键字优化必须依照哪些标准去实行更有效率?

共计 789 个字符,预计需要花费 2 分钟才能阅读完成。 针对从业 seo 优化工作中的 SEOer 而言,最关注的是关键字的排行榜状况了,每日看见排行榜的变化多端,情绪也跟随忽高忽低,一会儿...

2023年工作好找吗(seo工作好找吗)

2023年工作好找吗(seo工作好找吗)

今日在中午的讨论中与同事聊到,今年是毕业就业最为困难的一年,笔者当时突然想到一个问,既然大学没有开设 SEO 这门课程,但是每年还是有很多 SEO 新人进入这个行业,在招聘会上每天都会有人多人投递与...

网站页面设计技巧有哪些(网站页面设计技巧)

共计 2800 个字符,预计需要花费 7 分钟才能阅读完成。 网站页面设计技巧网站的设计既简单又复杂,一个成功的网站不仅仅要引人注目的设计,还要优秀的内容,让网站能成为一种独有的风格,这样用户才...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。