google数据分析方法论

简介: 写在前面作为开发同学,年初至今做了4个多月的数据分析工作,从刚开始的无从下手,到后来输出多个核心报表,解决了多个实际问题。这一路走来,的确有蛮多的心路历程,也积累了一些方法论。在此分享给同在数据分析路上摸索的小白同学。参考书籍:谷歌数据分析方法文章宗旨摒弃旧的思维模式,重新审视网络决策过程。更多的关注精确度,而不是准确度附:odps sql指令大全。(含示例数据构建,可以轻松学习各种用法)核心观点

写在前面

作为开发同学,年初至今做了4个多月的数据分析工作,从刚开始的无从下手,到后来输出多个核心报表,解决了多个实际问题。

这一路走来,的确有蛮多的心路历程,也积累了一些方法论。

在此分享给同在数据分析路上摸索的小白同学。

参考书籍:谷歌数据分析方法

文章宗旨

摒弃旧的思维模式,重新审视网络决策过程。

更多的关注精确度,而不是准确度

附:odps sql指令大全(含示例数据构建,可以轻松学习各种用法)

核心观点

  • 对于非确定性数据分析场景,需要先提出假设,再验证假设。不要做无目的的数据分析,否则事倍功半
  • 如果输入是垃圾,输出也是垃圾
  • 当你对数据有90%的信心时,就可以做决策了
  • 一次让人有所收获的决策,远比没有行动好
  • 不管你的网站为什么存在,人们会出于各种原因访问你的网站
  • 做出正确决策的障碍就是错误的判断机遇
  • 实现最优长尾策略
  • 发挥互联网测试和实验的力量(AB测试、组合测试)
  • 数据悖论

没有足够的数据你将无法做出决策,但即使有大量的数据,你仍然只能得出极少的见解

实践中的问题与反思

实现最优长尾策略

积少成多,看起来不起眼的资源,积累多了,反而比头部资源占比大很多。所以不要忽视那些看起来有点用,但是又不是很重要的资源。比如:搜索关键词优化、网站页面资源位。

不做无目的事

做数据分析的时候,有时候会漫无目的的跑数据,希望在数据海洋中得到一些新的见解,发现。

这件事本身问题也不大,但是不应该经常发生(比如在完全没有想法的时候,可以尝试通过实际操作提取灵感)。做事之前要有明确的目的、假设,带着问题出发,带着答案结束。这才是高效的工作,不至于迷失,浪费时间、精力,然后还得不到任何有效的结论。

及时行动

当你对数据有90%的信心时,就可以决策了;一次让人有所收获的决策,远比没有行动好

对于具体的问题,很难得到100%的答案,小心翼翼没有错,但这不是止步不前的理由。

对于不确信的决策,可以通过AB测试等方法进行验证,总之是要行动起来,不要坐以待毙。

AB测试

ab测试的要点

优先测试最重要的点,可能效果最好的点。这里是为了避免ab测试无法持续进行下去,没有起到真正的作用

保持测试变量的单一性。 基本原理

ab测试要有持续性。不要尝试了一次,没有拿到好的结果就放弃了。更错误的是,因为这一次失败的测试结果,得到一个错误的结论。得不偿失啊。

在当今互联网时代,ab测试相对已经很简单了,容错性好,实施性强,人力代价也不大。希望可以好好的利用起来。

方法论

网站关键指标

访客与访问(pv、uv)

页面停留时间和网站停留时间

跳出率(Bounce rate)

跳出率是衡量访客行为,几乎最重要的指标

如网站停留时间短于5s的会话所占的比例(作用于全网站或者单个页面)

退出率(Exit rate)

在某个页面有多少访客离开网站

退出率是从某个页面进入网站,但在某个特定页面退出访问的比例,跳出率是指从特定页面进入网站,什么都没做,又在相同页面退出的访问比例

转化率

转化为买家的比例

参与度

吸引关注和兴趣

访客浏览的页面越多,访问就越深入,参与度也越高

任务完成率

访客访问网站达到了他们预期目标的比例

搜索流量比例

来自搜索引擎的流量的比例

访客忠诚度和回访率

正面退出率

点击网站有价值的内容后而离开网站的访客比例

优秀指标的4个属性

  • 简单性(简单易懂)
  • 相关性(与业务相关)
  • 及时性(延迟)
  • 即时有用性(可以立马得出分析见解)

关于网站成功的3条经验

  • 不要过分追求完美

当你对数据有90%的信心时,就可以做决策了

一次让人有所收获的决策,远比没有行动好

  • 指标应少而精
  • 网站指标的生命周期极为重要

定义-》衡量-》分析-》行动-》改进 -》定义.....

  • 指标是指用来统计网站的事件和趋势的定量衡量指标,kpi是指目标达成度

点击流

访问

跳出率:从用户的角度体现了网站的糟糕程度

页面浏览量

单次访问页面数

平均网站停留时间

新访问比例

衡量购买前访问次数

我们常常忽略一个事实:用户通常不会在首次访问时就下单,大多数人在购买前需要访问网站3次,这3次访问时间跨度长达15天以上或者就在一天发生

流量来源产出报表,可以衡量输入和输出的价值关系

数据抽样

我们往往不愿相信数据量小反而比数据量大会更好。因此当我们被告知此数据基于抽样时总会有所顾忌。抽样的好处是快速,低成本

千万不要陷足于历史数据的泥潭,web网站分析数据的价值会随着时间推移而逐渐衰减

关注少数关键指标

从策略角度来看,网站要解决的最重要问题是什么

只用一项指标判断业务的成效,会是哪一项

哪些指标会显示当前优先级最高的3项业务的绩效

哪些数据是必须知道的,哪些只是锦上添花

把100美元用于网站运营,该怎么分配

业务的最大威胁是什么,怎么预警

关键指标不应该多于4个

转化率进阶

购物车和结算流程放弃率

购买前访问天数和次数

平均订单价值

识别可转化人群

发挥测试和实验的力量

线上测试的优势

不必猜测哪一种方案对网站最有效

可以提出大胆的方案,只要控制看到方案的人数就能消除风险

可以快速反复的试错,唯一的限制是网站流量和创意的多少

确定目标和期望产出

测试方法

A/B测试

多变量测试:在一个页面中同时测试多个不同的因素(组合测试,快速找出最优解)

黄金法则:以假设开始

必须先进行假设,而不是测试细节或场景。

第一次测试至关重要(可能会决定后续测试是否进行),需要测试最重要的部分

竞争情报分析

竞争情报是针对你的竞争对手、垂直市场或整个网络系统的数据分析

只有了解数据的收集过程,才能更好的利用他们

建议忽视绝对的数量,重视长期趋势

解决隐藏的数据分析陷阱

  • 准确性还是精确性:精确

不要纠结于数据质量,互联网不存在真正准确的数据

准确性是尽可能获得完美的数据,精确性是指为了获得同一结果需要达到的程度

精确性是可以预测的,追求准确性没有错,但平衡成本和受益更重要

原因:互联网可以快速低成本试错。准确性太耗时

  • 数据质量处理

收集干净的数据

要有取舍:平衡时间和其它因素

数据校验:定期校验

追求精确性

数据不完整不是问题:建议学会使用不完整的数据,并学习做出决定

快速行动,聪明思考

在互联网上,你的工作不完全是依赖于完整的数据,而是应该帮助公司更快的行动和更聪明的思考

  • 建立行动表盘

抓住重点,提供关键信息

创建可操作仪表盘

提供关键趋势和分析见解

提供改变现状需要的行动以及步骤

分析专家入门指南

目标

用行之有效的方法避免自己淹没在成堆的数据里,或是陷入分析的困境中

手段

  • 背景信息的重要性

通常数字本身的作用并不大,重要的是数字所在的背景信息和情况。背景信息是指主要指标周围的那些定量或者定性的信息,用来描述指标所处的背景情况

  • 比较不同时期的关键指标
  • 通过细分提供背景信息
  • 比较网站的关键指标平均值和细分值

平均值会产生误导,但也可以成为你的好帮手,尤其能提供你需要的原始背景

  • 你需要花费90%的时间为数据提供背景信息,以便提供线索让人们知道结果的好坏
  • 给指标寻找伴侣

当报表只显示一个指标时称为孤独指标,应该寻找伴侣指标,让你更加了解孤独指标的表现

  • 利用行业基准和竞争数据
  • 了解、呈现业务知识

当你展示数据时,你的目标是要体现出对变化的理解,从而可以将这些变化转换为行动,要用智慧解释数据趋势

  • 细分数据
  • 变化趋势会隐藏分析见解,如果比较趋势,最好是去看相关的细分数据变化趋势。
  • 在top10之外,什么改变了。(关注改变的地方)
  • 实现最优长尾策略(长尾影响总和往往大于头部)

数据分析专家的进阶指南

  • 多触点营销活动归因分析,归因模型

最后点击

把用户转化归因到最后一次点击上(常用)

第一次点击

把用户转化归因到第一次点击上

平均点击

把用户转化归因到历史点击上,平均分配功劳

功劳划分

将所有功劳的50%归于最后遇到的营销活动,其它的接触点平分剩余50%(较为公平)

  • 实际情况下归因分析的核心挑战

路径分析是使用归因分析遇到的最核心挑战

大多数数据分析新手想做网站路径分析,因为他们相信一系列完美的点击路径,会造成企业的成功。隐藏在背后的基本信念:网站是有结构的,就和书店超时一样。

事实证明,路径分析是浪费时间,因为互联网是没有结构的,它是混沌的

  • 关于多触点的思考

转化率将来自多个营销触点。在做任何事情之前,搞清楚百分比是多少,以及影响最大的渠道

  • 你的公司很少会为你提供时间来学习和成长,但你周围的环境总是与时俱进的。所以你要 跳出自己的世界,并为自己的成长负责

工具篇

Google Website Optimizer google网站优化工具

Google Analytics                 google点击流分析工具

iPerceptions 衡量任务完成率

竞争情报

Google Ad Planner、Insights for Search、Compete

用户反馈

4QiPerceptions

人工智能视觉热点图

http://www.feng-gui.com/

模拟看到网页前5s的人体视觉行为,基于用户最可能看到的事物和注意力流向的算法来创建热点图

目录
相关文章
|
4月前
|
数据挖掘 测试技术
产品运营方法论问题之运营过程中持续的数据分析如何解决
产品运营方法论问题之运营过程中持续的数据分析如何解决
|
数据挖掘
分享五个常用的数据分析方法论,让你的数据分析报告更上一层楼~
如果你在做数据分析的时候,发现自己常常不知道从哪些维度去开展分析或者分析出来的报告总感觉逻辑上不连贯,内容上不完整,那么你一定是缺乏一个合适的数据分析方法论来指导你进行数据分析。
808 0
分享五个常用的数据分析方法论,让你的数据分析报告更上一层楼~
|
新零售 大数据 数据挖掘
|
数据挖掘
从5W2H数据分析方法论谈起
看了小蚊子的书,里面有一个例子让我印象很深刻: 数据分析员对公司的某个业务进行了专项研究。每当完成专题分析向老板汇报分析结果是,老板首先问:“你的分析方法论是什么?将给我听听,我看分析报告就首先看你的分析方法论,如果分析方法论不正确或者不合理,那后面的分析结果也就没有必要看了,在一个不正确或者不合理的方法论的指导下,得到的分析结果是不可能正确的”。
852 0
|
3月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
75 2
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
167 4
|
3月前
|
机器学习/深度学习 算法 数据挖掘
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
本文介绍了2023年第二届钉钉杯大学生大数据挑战赛初赛A题的Python代码分析,涉及智能手机用户监测数据分析中的聚类分析和APP使用情况的分类与回归问题。
82 0
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
|
2天前
|
SQL 数据挖掘 Python
数据分析编程:SQL,Python or SPL?
数据分析编程用什么,SQL、python or SPL?话不多说,直接上代码,对比明显,明眼人一看就明了:本案例涵盖五个数据分析任务:1) 计算用户会话次数;2) 球员连续得分分析;3) 连续三天活跃用户数统计;4) 新用户次日留存率计算;5) 股价涨跌幅分析。每个任务基于相应数据表进行处理和计算。