写在前面
作为开发同学,年初至今做了4个多月的数据分析工作,从刚开始的无从下手,到后来输出多个核心报表,解决了多个实际问题。
这一路走来,的确有蛮多的心路历程,也积累了一些方法论。
在此分享给同在数据分析路上摸索的小白同学。
参考书籍:谷歌数据分析方法
文章宗旨
摒弃旧的思维模式,重新审视网络决策过程。
更多的关注精确度,而不是准确度
附:odps sql指令大全。(含示例数据构建,可以轻松学习各种用法)
核心观点
-
对于非确定性数据分析场景,需要先提出假设,再验证假设。不要做无目的的数据分析,否则事倍功半
-
如果输入是垃圾,输出也是垃圾
-
当你对数据有90%的信心时,就可以做决策了
-
一次让人有所收获的决策,远比没有行动好
-
不管你的网站为什么存在,人们会出于各种原因访问你的网站
-
做出正确决策的障碍就是错误的判断机遇
-
实现最优长尾策略
-
发挥互联网测试和实验的力量(AB测试、组合测试)
-
数据悖论
没有足够的数据你将无法做出决策,但即使有大量的数据,你仍然只能得出极少的见解
实践中的问题与反思
实现最优长尾策略
积少成多,看起来不起眼的资源,积累多了,反而比头部资源占比大很多。所以不要忽视那些看起来有点用,但是又不是很重要的资源。比如:搜索关键词优化、网站页面资源位。
不做无目的事
做数据分析的时候,有时候会漫无目的的跑数据,希望在数据海洋中得到一些新的见解,发现。
这件事本身问题也不大,但是不应该经常发生(比如在完全没有想法的时候,可以尝试通过实际操作提取灵感)。做事之前要有明确的目的、假设,带着问题出发,带着答案结束。这才是高效的工作,不至于迷失,浪费时间、精力,然后还得不到任何有效的结论。
及时行动
当你对数据有90%的信心时,就可以决策了;一次让人有所收获的决策,远比没有行动好
对于具体的问题,很难得到100%的答案,小心翼翼没有错,但这不是止步不前的理由。
对于不确信的决策,可以通过AB测试等方法进行验证,总之是要行动起来,不要坐以待毙。
AB测试
ab测试的要点
优先测试最重要的点,可能效果最好的点。这里是为了避免ab测试无法持续进行下去,没有起到真正的作用
保持测试变量的单一性。 基本原理
ab测试要有持续性。不要尝试了一次,没有拿到好的结果就放弃了。更错误的是,因为这一次失败的测试结果,得到一个错误的结论。得不偿失啊。
在当今互联网时代,ab测试相对已经很简单了,容错性好,实施性强,人力代价也不大。希望可以好好的利用起来。
方法论
网站关键指标
访客与访问(pv、uv)
页面停留时间和网站停留时间
跳出率(Bounce rate)
跳出率是衡量访客行为,几乎最重要的指标
如网站停留时间短于5s的会话所占的比例(作用于全网站或者单个页面)
退出率(Exit rate)
在某个页面有多少访客离开网站
退出率是从某个页面进入网站,但在某个特定页面退出访问的比例,跳出率是指从特定页面进入网站,什么都没做,又在相同页面退出的访问比例
转化率
转化为买家的比例
参与度
吸引关注和兴趣
访客浏览的页面越多,访问就越深入,参与度也越高
任务完成率
访客访问网站达到了他们预期目标的比例
搜索流量比例
来自搜索引擎的流量的比例
访客忠诚度和回访率
正面退出率
点击网站有价值的内容后而离开网站的访客比例
优秀指标的4个属性
-
简单性(简单易懂)
-
相关性(与业务相关)
-
及时性(延迟)
-
即时有用性(可以立马得出分析见解)
关于网站成功的3条经验
-
不要过分追求完美
当你对数据有90%的信心时,就可以做决策了
一次让人有所收获的决策,远比没有行动好
-
指标应少而精
-
网站指标的生命周期极为重要
定义-》衡量-》分析-》行动-》改进 -》定义.....
-
指标是指用来统计网站的事件和趋势的定量衡量指标,kpi是指目标达成度
点击流
访问
跳出率:从用户的角度体现了网站的糟糕程度
页面浏览量
单次访问页面数
平均网站停留时间
新访问比例
衡量购买前访问次数
我们常常忽略一个事实:用户通常不会在首次访问时就下单,大多数人在购买前需要访问网站3次,这3次访问时间跨度长达15天以上或者就在一天发生
流量来源产出报表,可以衡量输入和输出的价值关系
数据抽样
我们往往不愿相信数据量小反而比数据量大会更好。因此当我们被告知此数据基于抽样时总会有所顾忌。抽样的好处是快速,低成本。
千万不要陷足于历史数据的泥潭,web网站分析数据的价值会随着时间推移而逐渐衰减
关注少数关键指标
从策略角度来看,网站要解决的最重要问题是什么
只用一项指标判断业务的成效,会是哪一项
哪些指标会显示当前优先级最高的3项业务的绩效
哪些数据是必须知道的,哪些只是锦上添花
把100美元用于网站运营,该怎么分配
业务的最大威胁是什么,怎么预警
关键指标不应该多于4个
转化率进阶
购物车和结算流程放弃率
购买前访问天数和次数
平均订单价值
识别可转化人群
发挥测试和实验的力量
线上测试的优势
不必猜测哪一种方案对网站最有效
可以提出大胆的方案,只要控制看到方案的人数就能消除风险
可以快速反复的试错,唯一的限制是网站流量和创意的多少
确定目标和期望产出
测试方法
A/B测试
多变量测试:在一个页面中同时测试多个不同的因素(组合测试,快速找出最优解)
黄金法则:以假设开始
必须先进行假设,而不是测试细节或场景。
第一次测试至关重要(可能会决定后续测试是否进行),需要测试最重要的部分
竞争情报分析
竞争情报是针对你的竞争对手、垂直市场或整个网络系统的数据分析
只有了解数据的收集过程,才能更好的利用他们
建议忽视绝对的数量,重视长期趋势
解决隐藏的数据分析陷阱
-
准确性还是精确性:精确
不要纠结于数据质量,互联网不存在真正准确的数据
准确性是尽可能获得完美的数据,精确性是指为了获得同一结果需要达到的程度
精确性是可以预测的,追求准确性没有错,但平衡成本和受益更重要
原因:互联网可以快速低成本试错。准确性太耗时
-
数据质量处理
收集干净的数据
要有取舍:平衡时间和其它因素
数据校验:定期校验
追求精确性
数据不完整不是问题:建议学会使用不完整的数据,并学习做出决定
快速行动,聪明思考
在互联网上,你的工作不完全是依赖于完整的数据,而是应该帮助公司更快的行动和更聪明的思考
-
建立行动表盘
抓住重点,提供关键信息
创建可操作仪表盘
提供关键趋势和分析见解
提供改变现状需要的行动以及步骤
分析专家入门指南
目标
用行之有效的方法避免自己淹没在成堆的数据里,或是陷入分析的困境中
手段
-
背景信息的重要性
通常数字本身的作用并不大,重要的是数字所在的背景信息和情况。背景信息是指主要指标周围的那些定量或者定性的信息,用来描述指标所处的背景情况
-
比较不同时期的关键指标
-
通过细分提供背景信息
-
比较网站的关键指标平均值和细分值
平均值会产生误导,但也可以成为你的好帮手,尤其能提供你需要的原始背景
-
你需要花费90%的时间为数据提供背景信息,以便提供线索让人们知道结果的好坏
-
给指标寻找伴侣
当报表只显示一个指标时称为孤独指标,应该寻找伴侣指标,让你更加了解孤独指标的表现
-
利用行业基准和竞争数据
-
了解、呈现业务知识
当你展示数据时,你的目标是要体现出对变化的理解,从而可以将这些变化转换为行动,要用智慧解释数据趋势
-
细分数据
-
变化趋势会隐藏分析见解,如果比较趋势,最好是去看相关的细分数据变化趋势。
-
在top10之外,什么改变了。(关注改变的地方)
-
实现最优长尾策略(长尾影响总和往往大于头部)
数据分析专家的进阶指南
-
多触点营销活动归因分析,归因模型
最后点击
把用户转化归因到最后一次点击上(常用)
第一次点击
把用户转化归因到第一次点击上
平均点击
把用户转化归因到历史点击上,平均分配功劳
功劳划分
将所有功劳的50%归于最后遇到的营销活动,其它的接触点平分剩余50%(较为公平)
-
实际情况下归因分析的核心挑战
路径分析是使用归因分析遇到的最核心挑战
大多数数据分析新手想做网站路径分析,因为他们相信一系列完美的点击路径,会造成企业的成功。隐藏在背后的基本信念:网站是有结构的,就和书店超时一样。
事实证明,路径分析是浪费时间,因为互联网是没有结构的,它是混沌的
-
关于多触点的思考
转化率将来自多个营销触点。在做任何事情之前,搞清楚百分比是多少,以及影响最大的渠道
-
你的公司很少会为你提供时间来学习和成长,但你周围的环境总是与时俱进的。所以你要 跳出自己的世界,并为自己的成长负责
工具篇
Google Website Optimizer google网站优化工具
Google Analytics google点击流分析工具
iPerceptions 衡量任务完成率
竞争情报
Google Ad Planner、Insights for Search、Compete
用户反馈
4QiPerceptions
人工智能视觉热点图
模拟看到网页前5s的人体视觉行为,基于用户最可能看到的事物和注意力流向的算法来创建热点图