网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题|学习笔记

简介: 快速学习网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第四阶段)网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/696/detail/12242


网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题


1、页面路径转化率的分析分析背后会包含非常生动的模型叫做漏斗模型在企业业务会定一个目标目标跟需求相关到达目标要制定业务流程流程有各不同的步骤用户按照步骤层层递进的过程最终到达目标问题在于在递进过程用户会因为各种各样内部外部的原因离开转化流程就会使得数据越越少最后形成漏斗模型上面大下面小漏斗模型可以到相关转化率的情况或流失率的情况根据相关的问题做出相关的改变

2、漏斗模型可以计算哪些指标并且在漏斗模型还隐藏着 have 非常深的问题因为如果只业务模型都可以理解非常的方便也非常的生动形象问题在于如何把指标转化成的 sql 层面进行计算

3、打开画图板进行逐级递减在企业所希望的是100%在层层递减的过程就形成漏斗模型

image.png

化,业务中制定的目标了到达目标会制定业务流程,在指引用根据流程到达目标的过程称之为转化

step

nums

1

1000

2

800

3

500

4

200

在漏斗模型中计算最多的就是转化率相反的词叫做流失率转数学层面可以知道转化率和流失率是同一种现象两种不同角度的描述转化60%意味着流失40%加起等于一每一步相对第一步的转化率都跟第一步相比较叫做绝对转化每一步相对上一步的转化率就是两步骤之间衔接有没有问题叫做相对转化业务从背后理解就是相处的过程比如500除以800是第三步相对于第二步,200除以500是第四相对于第三步寻找规律发现不管是绝对转化还是相对转化现象就是记算第二步的绝对转化需要第二步的数据800以及第一步的数据相处才能得到如果计算第四步的绝对转化需要第四步的200和第一步的1000,2001000才可以得到同样后面的指标也有规律存在

4、规律计算的每个指标除了依赖自己的当前行的数据还依赖之前行的数据一个指标的计算除自己当前相关还跟上一行相关称之为hive级联求和问题如果直接写sql是计算不出不可以两行数据第一行的一列第二行的一列进行操作因为当下操作sql的操作表的方式是基于行的就是能拿到一行一行的不同列不可能拿到多行取不同的

5、针对级别集合问题解题思路

自己和自己进行关联 join本质原因在于通过自己和自己 join 可以把当前行和之前行出现在一行中

6、比如数据处在三行中,如果需要a除以C或者C除以a不好操作但是如果给的数据是 abc 放在一行中可以在一行拿第一个字段和第三个字段本质是如何ab个出现在两行中变成一行join 就可以改变它不同列的abc可以出现九种结果可以通过 join 把数据多行变成一行再根据相关的规律寻找计算即可所以集合问题背后的规律非常重要只要发现出现一个指标需要当前行的数据和上一行的数据就用自己和自己join进行解决这是突破一类问题的核心点

相关实践学习
通过日志服务实现云资源OSS的安全审计
本实验介绍如何通过日志服务实现云资源OSS的安全审计。
相关文章
|
5月前
|
监控 安全 搜索推荐
使用EventLog Analyzer进行日志取证分析
EventLog Analyzer助力企业通过集中采集、归档与分析系统日志及syslog,快速构建“数字犯罪现场”,精准追溯安全事件根源。其强大搜索功能可秒级定位入侵时间、人员与路径,生成合规与取证报表,确保日志安全防篡改,大幅提升调查效率,为执法提供有力证据支持。
219 0
|
7月前
|
监控 安全 NoSQL
【DevOps】Logstash详解:高效日志管理与分析工具
Logstash是ELK Stack核心组件之一,具备强大的日志收集、处理与转发能力。它支持多种数据来源,提供灵活的过滤、转换机制,并可通过插件扩展功能,广泛应用于系统日志分析、性能优化及安全合规等领域,是现代日志管理的关键工具。
1101 0
|
9月前
|
自然语言处理 监控 安全
阿里云发布可观测MCP!支持自然语言查询和分析多模态日志
阿里云可观测官方发布了Observable MCP Server,提供了一系列访问阿里云可观测各产品的工具能力,包含阿里云日志服务SLS、阿里云应用实时监控服务ARMS等,支持用户通过自然语言形式查询
1313 0
阿里云发布可观测MCP!支持自然语言查询和分析多模态日志
|
8月前
|
人工智能 运维 监控
Aipy实战:分析apache2日志中的网站攻击痕迹
Apache2日志系统灵活且信息全面,但安全分析、实时分析和合规性审计存在较高技术门槛。为降低难度,可借助AI工具如aipy高效分析日志,快速发现攻击痕迹并提供反制措施。通过结合AI与学习技术知识,新手运维人员能更轻松掌握复杂日志分析任务,提升工作效率与技能水平。
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
4357 31
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
9月前
|
监控 容灾 算法
阿里云 SLS 多云日志接入最佳实践:链路、成本与高可用性优化
本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS),解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent(iLogtail/LoongCollector)在海外场景的应用,推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案,包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等,并提供了成本优化策略和多目标发送配置指导,帮助企业构建稳定、低成本、高可用的全球日志系统。
982 54
|
监控 安全 Apache
什么是Apache日志?为什么Apache日志分析很重要?
Apache是全球广泛使用的Web服务器软件,支持超过30%的活跃网站。它通过接收和处理HTTP请求,与后端服务器通信,返回响应并记录日志,确保网页请求的快速准确处理。Apache日志分为访问日志和错误日志,对提升用户体验、保障安全及优化性能至关重要。EventLog Analyzer等工具可有效管理和分析这些日志,增强Web服务的安全性和可靠性。
450 9
|
存储 SQL 关系型数据库
MySQL日志详解——日志分类、二进制日志bin log、回滚日志undo log、重做日志redo log
MySQL日志详解——日志分类、二进制日志bin log、回滚日志undo log、重做日志redo log、原理、写入过程;binlog与redolog区别、update语句的执行流程、两阶段提交、主从复制、三种日志的使用场景;查询日志、慢查询日志、错误日志等其他几类日志
943 35
MySQL日志详解——日志分类、二进制日志bin log、回滚日志undo log、重做日志redo log
|
12月前
|
存储 缓存 关系型数据库
图解MySQL【日志】——Redo Log
Redo Log(重做日志)是数据库中用于记录数据页修改的物理日志,确保事务的持久性和一致性。其主要作用包括崩溃恢复、提高性能和保证事务一致性。Redo Log 通过先写日志的方式,在内存中缓存修改操作,并在适当时候刷入磁盘,减少随机写入带来的性能损耗。WAL(Write-Ahead Logging)技术的核心思想是先将修改操作记录到日志文件中,再择机写入磁盘,从而实现高效且安全的数据持久化。Redo Log 的持久化过程涉及 Redo Log Buffer 和不同刷盘时机的控制参数(如 `innodb_flush_log_at_trx_commit`),以平衡性能与数据安全性。
684 5
图解MySQL【日志】——Redo Log