如何科学有效的分析网站日志

通过网站日志,我们可以获知百度蜘蛛的一些行踪。从而有的放矢的来调整与优化网站。让蜘蛛更好的遍历我们的站点。那么,我们如何解读网站日志呢?

首先,对于普通企业站点而言,可以简单借助《光年SEO日志分析系统》,门户大站系列建议根据需求可以开发自己的日志分析系统。

其次,下载网站日志,借助光年软件分析网站日志。分析完毕后会输出一份结果。

最后,一起来学习下光年分析结果涉及到的一些知识:

概要分析:

(1)总抓取量:这里是指在某段时间内蜘蛛多次访问共抓取的网页总量

(2)访问次数:这里是指某段时间某个蜘蛛访问你网站的次数

(3)总停留时间:这里是指你所提交的某段时间的网站日志中某种蜘蛛的停留时间

通过这三者可以了解到以下2个数据(与网站性能有关):

(1)平均抓取页面数=总抓取量/访问次数(通过对比值,可以反应出网站是否有异常)

(2)每次抓取耗时=总停留时间/总抓取量(通过这个可以了解到网站服务器速度问题)

目录抓取

通过目录抓取可了解蜘蛛抓取分布情况,可根据这个数据反馈,综合调整。

页面抓取

通过页面抓取可以了解到哪些页面是蜘蛛重复抓取的,对于一些不重要页面又被蜘蛛重复抓取的话,可以针对性的来调整处理。

梳理完了以上的知识后,我们如何通过这些数据,做一些有效的决策呢?

首先,你得长期观察这些数据,通过对比,才能发现问题

如某位行业大牛每天会观察的一组数据:

某频道爬虫每日抓取量

某频道爬虫每日不重复抓取量

某频道爬虫单页下载时间

某频道网页响应速度

某频道每日爬虫到访次数

某频道Top目录

某频道收录比例抽查

某频道响应代码统计

其次,通过抓取量的表现,找出影响收录量的原因所在。

最后,进行调整优化,做好数据监控。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 175,633评论 25 709
  • 中国互联网用户群已经成为世界最大的互联网群体。与此同时,中国互联网网站的发展也历经了几个阶段,从单纯的网络媒体到现...
    零一间阅读 9,928评论 1 41
  • “给生命线最终找到靠依,然后留下长住你心里,最深处是我地址,小小玩意纹着彼此名字,留待明日传颂你我,这一世完美情史...
    铭玥咏全阅读 1,105评论 0 0
  • 11月中,回到之前工作的家综参加培训,一时百感交集,不过那个场地已非当日室仅方丈的党员之家。“高端大气上档次”也不...
    黄家公子铭阅读 2,828评论 0 1