网站流量日志分析--分析指标和分析模型--复合级指标|学习笔记

简介: 快速学习网站流量日志分析--分析指标和分析模型--复合级指标

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第三阶段) 网站流量日志分析--分析指标和分析模型--复合级指标】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/695/detail/12209


网站流量日志分析--分析指标和分析模型--复合级指标


内容介绍:

一.平均访问频度

二.人均浏览页数(平均访问深度)

三.平均访问时长

四.跳出率

 

复合级指标就是把一些基础指标做一些相关的组合。这些复合级指标在企业当中有具体的业务含义和需求,对于开发的来说,需要注意的是如何去解读这些复合机指标,把里面的业务,背景弄清楚,并且思考通过计算得出这些复合级指标。接下来介绍四个常见的复合级指标。


一.平均访问频度

第一个指标叫做平均访问频度,看到平均应该就会想到有一个除法操作,只有谁除以谁才可以得到一个平均。平均访问频度指的是平均每个独立访客一天内访问网站的次数或产生的 session 个数。通俗的说,一天之内每个人产生的平均会话数是多少。再直白一些,就是一个人一天来了几次。

所以,要想得到复合指标,需要得到一天内总的会话次数(session)/总的独立访客数。这两个数相除就得到了每个人一天之内人均会话数。而这两个指标指的就是基础指标中的VV和UV,即VV/UV,用VV除以UV就可以得到今天人均产生的会话数。但是这里有一个更专业的说法叫做平均访问频度。

平均访问频度一天之内人数均会话数

==总的会话次数(session)/总的独立访客数

==VV/UV


二.人均浏览页数(平均访问深度)

第二个复合级指标指的是人均浏览页数,它也有一个专业的说法叫做平均访问深度。深入的意思指的是当去浏览一个网站,或者打开一个页面就走了,浏览的深度就不够深。若浏览了七八个页面,十几个页面,说明在网站逗留的时间比较长,浏览的深度就比较多一点。所以平均访问深度背后所描述的是人均浏览的页数,这个均字又想到了一个除法,要用总的浏览页除以人,就得到了平均访问深度。

平均访问深度:一天之内人均浏览页面数。要想得到这个指标,用总的页面浏览数据/总的独立访客数。今天总的页面浏览数,打开页面就加一,指的就是PV,即等于 PV/UV。会发现它就是一些基础指标的复合,平均访问深度的好处是可以体现出网站对用户的吸引程度,一个吸引力。例如A网站的人均页数是3.2,B网站的人均页数是7.8,意味着一个人只要来到B网站,通常会打开七八个页面,这个网站肯定会有吸引力。如果你的网站人均浏览页数只有一点几,那意味着你的网站吸引力不够好。

但是需要知道,不会出现一个网站的人均浏览页数是零点几,小于一的情况。因为来到一个网站至少会打开一个页面,所以是至少一个PV,那么平均下来这个值至少是等于一。如果今天都来,这个网站都打开一次,那么平均下来平均值也是一,那一定不可能会产生小于一的情况。所以这种规定也从侧面告诉我们,在计算的时候,也可以帮我们去评估计算的指标到底有没有问题,这就是第二个指标人均浏览页数,也可以把它称之为平均访问深度。

平均访问深度:一天之内人均浏览页面数

==总的页面游览数、总的独立访客数

==PV/UV


三.平均访问时长

第三个指标叫做平均访问时长,它所描述的是平均每次访问在网站上停留的时间。要想计算这个指标,需要总的停留时间除以每次会话的次数。

这个指标非常简单,叫做平均访问时长。平均会话时长:平均每次会话停留的时间。需要用总的会话停留时间/会话次数,总的会话时间,需要把每次会话的时间加起来,会话次数就是俗称的 VV,这两个指标相除,就可以得到平均访问时长。平均访问时长也可体现出网站对访客的吸引程度,别人来到这个网站,平均访问时长只有一点几秒钟,打开一下网站就关闭走了,那这个网站是没有任何吸引程度的。若打开另一个网站,在这个页面上至少待个三五分钟,两三百秒,说明这个网站还是很有吸引力的,愿意花时间在这个网站上浏览一些信息。所以说些指标是有用的,它可以帮助我们业务去解读一些情况,体现网站对用户的吸引程度。

平均会话时长:平均每次会话停留的时间

=总的会话停留时间/会话次数vv


四.跳出率

第四个复合级指标叫做跳出率,这个指标描述的比较专业,即是指用户到达你的网站上,并在你的网站上仅浏览了一个页面就离开的访问次数与所有访问次数的百分比。若一个人今天来了,并且只浏览了一个页面,这样的人数与总的访问次数的百分比,就是跳出率。例如,进行计算首页的跳出率,需要去找出今天访问网站,第一个要求是访问网站且访问一个页面,这个页面要计算的是首页跳出率,所以该页面要是首页。

这样的访问次数,和总的访问次数的百分比,得出的就是首页的跳出率。即:首页跳出率=访问网站且访问一个页面且该页面是首页/总的访问次数。那么跳出率可以用来衡量网站在某个页面上的浏览情况,也是评价网站性能的重要指标。例如A网站首页跳出率为百分之百,可以解读为今天来到这个公司的用户都只打开一个页面,而页面都是主页,他们打开页面之后再也不往下继续浏览了,这意味着你们公司,你们网站对用户的吸引程度为0。跳出率为零意味着没有一个页面从页面上流失,大家都在这个页面上浏览,继续浏览其他页面,这是一个网站比较好的情况。

因此以上所说的几个复合级指标帮助业务,帮助需求,甚至帮助公司的老板去看待网站经营访问的情况。要做的就是要正确的解读这些指标背后所包含的业务含义,当中有无存在业务歧义,有无存在中文误差,时间范围到底是一天之内,还是一个月之内。每个公司都是不一样的,例如它让我们计算的一周之内的平均访问深度,也是可以计算的。理清沟通好确定出来这些复合极指标的具体含义,再根据这些含义去寻找相关的数据,思考如何通过处理数据把这些指标计算出来,这是作为大数据人员的职业。这就是第二类指标:复合级指标。

image.png

相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
相关文章
|
存储 Java 关系型数据库
基于JSP的九宫格日志网站
基于JSP的九宫格日志网站
|
监控 安全 前端开发
Nginx 访问日志中有 Get 别的网站的请求是什么原因?
Nginx 访问日志中有 Get 别的网站的请求是什么原因?
268 0
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
3808 31
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
7月前
|
监控 容灾 算法
阿里云 SLS 多云日志接入最佳实践:链路、成本与高可用性优化
本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS),解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent(iLogtail/LoongCollector)在海外场景的应用,推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案,包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等,并提供了成本优化策略和多目标发送配置指导,帮助企业构建稳定、低成本、高可用的全球日志系统。
834 54
|
监控 安全 Apache
什么是Apache日志?为什么Apache日志分析很重要?
Apache是全球广泛使用的Web服务器软件,支持超过30%的活跃网站。它通过接收和处理HTTP请求,与后端服务器通信,返回响应并记录日志,确保网页请求的快速准确处理。Apache日志分为访问日志和错误日志,对提升用户体验、保障安全及优化性能至关重要。EventLog Analyzer等工具可有效管理和分析这些日志,增强Web服务的安全性和可靠性。
376 9
|
XML JSON Java
Logback 与 log4j2 性能对比:谁才是日志框架的性能王者?
【10月更文挑战第5天】在Java开发中,日志框架是不可或缺的工具,它们帮助我们记录系统运行时的信息、警告和错误,对于开发人员来说至关重要。在众多日志框架中,Logback和log4j2以其卓越的性能和丰富的功能脱颖而出,成为开发者们的首选。本文将深入探讨Logback与log4j2在性能方面的对比,通过详细的分析和实例,帮助大家理解两者之间的性能差异,以便在实际项目中做出更明智的选择。
1279 3
|
10月前
|
存储 SQL 关系型数据库
MySQL日志详解——日志分类、二进制日志bin log、回滚日志undo log、重做日志redo log
MySQL日志详解——日志分类、二进制日志bin log、回滚日志undo log、重做日志redo log、原理、写入过程;binlog与redolog区别、update语句的执行流程、两阶段提交、主从复制、三种日志的使用场景;查询日志、慢查询日志、错误日志等其他几类日志
834 35
MySQL日志详解——日志分类、二进制日志bin log、回滚日志undo log、重做日志redo log
|
10月前
|
存储 缓存 关系型数据库
图解MySQL【日志】——Redo Log
Redo Log(重做日志)是数据库中用于记录数据页修改的物理日志,确保事务的持久性和一致性。其主要作用包括崩溃恢复、提高性能和保证事务一致性。Redo Log 通过先写日志的方式,在内存中缓存修改操作,并在适当时候刷入磁盘,减少随机写入带来的性能损耗。WAL(Write-Ahead Logging)技术的核心思想是先将修改操作记录到日志文件中,再择机写入磁盘,从而实现高效且安全的数据持久化。Redo Log 的持久化过程涉及 Redo Log Buffer 和不同刷盘时机的控制参数(如 `innodb_flush_log_at_trx_commit`),以平衡性能与数据安全性。
489 5
图解MySQL【日志】——Redo Log
|
9月前
|
监控 Java 应用服务中间件
Tomcat log日志解析
理解和解析Tomcat日志文件对于诊断和解决Web应用中的问题至关重要。通过分析 `catalina.out`、`localhost.log`、`localhost_access_log.*.txt`、`manager.log`和 `host-manager.log`等日志文件,可以快速定位和解决问题,确保Tomcat服务器的稳定运行。掌握这些日志解析技巧,可以显著提高运维和开发效率。
957 13