网站流量日志分析—分析指标和分析模型—受访、访客分析模型|学习笔记

简介: 快速学习网站流量日志分析—分析指标和分析模型—受访、访客分析模型

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第三阶段) 网站流量日志分析—分析指标和分析模型—受访、访客分析模型】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/695/detail/12211


网站流量日志分析—分析指标和分析模型—受访、访客分析模型


受访这两个字可以理解为受到访问,它所描述的就是网站的页面和域名被用户访问的情况。

打开数据看一下,在数据当中正好有一个字段叫做 request ,z 这个字段所描述的是用户请求网站,请求的是哪一个资源哪一个路径,比如说有的是图片,有的是请求的文本,还有请求斜杆的,通过专业知识解读应该知道背后所反应请求的是网站的首页,因为只有该目录下问页面就是首页。那么这个就是表示用户访问网站的受访情况,可以

image.png

分析好多指标,比如统计昨天访问页面受访页面,看一下昨天的页面有哪几个分别访问多少,这时候可以看一下对比分析,分析2018年1月1号访问网站最多的页面是首页,但是发现1月2号首页下降20%,登录页做了一个上升,注册页做了一个上升,这样再做一个升降榜,这样就可以看到每天的访问页面波动情况。这些指标最终计算出来可能难度不大,根据不同栏目不同的页面进行分组同进,但是构建出来这样的一个升降榜,波动情况又构成了一个受访分析模型。

image.png

如上图,左边就是统计每个页面的情况,比如斜杠代表根目录,具体到下面每个字,当中有当天请求页面数还有升降波动的情况,比如昨天是100今天是800,降了20%,今天升了35%,昨天和今天持平,这样看一眼页面在这一天相对于昨天波动情况,这个就构成第二个受访分析。

接下来最后一个分析是访客分析,主要与用户相关。访客分析分析很多,根据 IP 关联不同地方,对应上的网站息息相关。比如说游戏直播类的网站,直播最重要的是带宽网站的一个访问速度,国内有不同的运营商电信,移动,如果五个省运营商配合的不好,发现访问网站之后非常卡,用户将变低,低了之后不能刷礼物,收入情况降低,所以这个开展分析。再比如说终端情况分析,终端在数据当中有一个字段,叫做 user agent 检测 ua 就是终端信息,这里面可以记录下来访问的网站使用的是什么浏览器,什么版本,什么平台。根据终端就可以解读出来这个用户是怎么来的,当下企业当中访问网站主流的两种情况,要么是 PC 电脑端,要么手机移动端,同样的访问针对不同的终端需要进行不同的优化,以手机来说是分为安卓和苹果手机,同样的 PC 端分为 windows 平台、Mark 平台,对它进行优化。如果发现公司当中90%的人都是通过安卓手机来的,是否对安卓手机进行相关特殊的优化。

接下来是新老访客分析,新访是没有来过,老访是来过,问题在于怎样把新老访客分析计算出来。举个例子,今天通过相关的计算得到一些IP ,今天的访客有 IP1、IP2、IP3,这些访客哪些是新哪些是老,做一个比对,这时候把这两个数据作为一个关联比较判断,当中有的,能查询到就是老访客,没有就是新访客,这样又能构成一个模型进行相关的展示。

image.png

有个图叫做热力图(如上图),这个在全国重大场合都能看到这个图,这个图是不同省份不同地域所在的百分比情况,非常直观便捷,统计出来北京来了50%,上海来了20%,广东来了10%,这些数据计算出来直接给人看肯定会是枯燥无聊的,不能够理解,但是来到热力图,相信只要眼睛不是有问题,颜色越深来的越多,颜色越浅的来的越少,这就是另外一个展示模型。可以发现这里所说的各种模型背后都跟数据展示,数据课时化相关,这些模型所展示的是所分析的指标,所分析的数据到底以何种形式更加友好,更加理解的方式展示给别人看,而不是直接把分析的指标非常枯燥,呆板展示出来,这就是所谓的分析模型,分析模型结合分析指标就可以构成网站分析最终课时化展示的数据,当然还要强调这些模型指标是不断维护发展的过程,所以随着业务不断进行开展,指标越来越多,展示的模型展现的越来越多,这就是网站分析当中常见的分析模型。

相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
相关文章
|
存储 运维 监控
超越传统模型:从零开始构建高效的日志分析平台——基于Elasticsearch的实战指南
【10月更文挑战第8天】随着互联网应用和微服务架构的普及,系统产生的日志数据量日益增长。有效地收集、存储、检索和分析这些日志对于监控系统健康状态、快速定位问题以及优化性能至关重要。Elasticsearch 作为一种分布式的搜索和分析引擎,以其强大的全文检索能力和实时数据分析能力成为日志处理的理想选择。
852 6
|
运维 监控 Cloud Native
一行代码都不改,Golang 应用链路指标日志全知道
本文将通过阿里云开源的 Golang Agent,帮助用户实现“一行代码都不改”就能获取到应用产生的各种观测数据,同时提升运维团队和研发团队的幸福感。
655 131
|
9月前
|
人工智能 运维 监控
一招高效解析 Access Log,轻松应对泼天流量
一招高效解析 Access Log,轻松应对泼天流量
174 0
一招高效解析 Access Log,轻松应对泼天流量
|
PyTorch 算法框架/工具
Pytorch学习笔记(七):F.softmax()和F.log_softmax函数详解
本文介绍了PyTorch中的F.softmax()和F.log_softmax()函数的语法、参数和使用示例,解释了它们在进行归一化处理时的作用和区别。
1352 1
Pytorch学习笔记(七):F.softmax()和F.log_softmax函数详解
|
SQL 存储 人工智能
阿里云日志服务的傻瓜式极易预测模型
预测服务有助于提前规划,减少资源消耗和成本。阿里云日志服务的AI预测服务简化了数学建模,仅需SQL操作即可预测未来指标,具备高准确性,并能处理远期预测。此外,通过ScheduledSQL功能,可将预测任务自动化,定时执行并保存结果。
308 3
|
jenkins 持续交付
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
|
监控 网络协议 CDN
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
|
存储 弹性计算 运维
可观测性体系问题之Process Layer在ECS稳定性平台中的工作如何解决
可观测性体系问题之Process Layer在ECS稳定性平台中的工作如何解决
137 0