一、能力VS知识
什么是能力?举个简单的例子:
1、知识(knowledge):统计学讲的回归分析方程 y=ax+b,以及SST、SSR、SSE、R平方等概念是知识。知识是有科学理论基础的,有出处的。
2、技能(Skill):敲出来:from sklearn.learn_model import LinearRegression 是一个技能。技能可以通过操练提高,而且使用技能的时候,你完全不用懂背后的科学原理,会操作就行。
3、能力(Ability):运营部门想预测下下个月的GMV,知道拿几个指标,用回归分析来预测,这是一种能力。能力是在现实工作场景中,因地制宜地使用知识和技能。
能力是很重要的!因为现实中工作场景很复杂,比如预测下个月GMV,有好多种方法可以用:时间序列预测、滚动预测、业务模型预测、回归模型预测、拍脑袋……,不同的方法,需要的数据不一样,产生的效果也不一样,因此需要具体思考。
并且,做工作不是做学术研究,还得考虑以下跟人有关的复杂情况,因此更得会随机应变见风使舵了。
- 业务部门能不能理解
- 领导接不接受结果
- 领导想手动调整下结果……
那么,哪些能力是必备的呢?从完成一个项目的角度,我觉得有这7种能力。
二、七大能力
完成一个数据分析项目,至少有4步:
1、明确目标
2、选择数据
3、进行分析
4、汇报结果
为了做好项目,则至少需要7大能力(如下图)
能力一:理解业务。
这是所有工作的基础,想做分析,至少得知道:
1、业务流程是啥
2、业务方会做哪些动作
3、业务方期望的结果是啥
这样后续才有分析目标,才能看数据是否足够多。
能力二:梳理需求
这一步经常被新人遗忘,因为大家习惯了等着业务下需求单/发个邮件/打个电话/拍一下肩膀,然后要个数。从而忘记了:我们想做一个完整的分析报告,而不是跑个数呀!
想要做一个完整的分析,有清晰的需求是第一位的。“歪,给我个XX数!”不算是清晰的需求,只是个口头要求而已。
清晰的需求,至少得说清楚5w才行:
Who:数据使用者
When:数据使用时间
Where:数据使用场合
Why:使用数据原因
What:具体数据格式
特别是Why,直接和分析思路有关,要重点区分业务部门想:
- 要做监控、找原因、还是做预测?
- 如是监控,是否业务已上线?什么时候上?
- 监控数据是否涉及埋点、系统对接?
- 找原因,是否有假设?假设是什么?
- 做预测,是否有假设?假设是什么?
这样才能避免,辛辛苦苦跑一堆数,被批斗:“没啥用”“我早知道了”的问题。
能力三:梳理指标体系
指标体系是数据分析的左手。梳理清楚一个项目需要哪些指标,才好继续深入。有些小伙伴很偷懒,总想着找一份“完整的”指标体系,熟读并背会就可以。可实际工作中,业务流程经常有变化,导致很多过程指标需要重新确认,并不是找个模板套就可以的。
并且,有些过程指标数据采集难度很大,还得考虑怎么和开发谈判,尽可能保障收集。因此梳理指标体系是个重要能力。
能力四:梳理标签体系
标签体系是数据分析右手。很多时候,业务部门想分析的对象不是指标可以描述的,比如分析“高潜力”,分析“有意向”,分析“刚需型用户”,这些都是通过标签,具象化了一个业务描述。
想要把问题分析清楚,数据分析师就得有能力打标签,有能力把一个业务场景中标签梳理清楚(如下图)。
注意!业务部门经常有一些内部约定俗成的标签说法,不同部门之间标签口径混乱是常有的事。因此真要做标签梳理,就得有谈判能力,拉各路相关方坐下来慢慢谈。
能力五:选择分析方法
开篇的例子,就是个选择分析方法的典型例子。比如:
预测类分析:n个模型可以用,用哪个?
原因类分析:从哪个角度切入?如何构建逻辑?
检验类分析:假设是什么?从哪些角度检验?
评估类分析:从哪些角度评估更合理、全面?
这些都是要考虑的问题
教科书上虽然有标准的方法, 但怎么结合实际,特别是怎么让业务部门配合过程,接受结果,则是个大学问。经常有一些复杂的方法,被业务部门斥责“看不懂!”“莫名其妙!”而遭受非议,所以选择分析方法,是一个重要能力。
能力六:设计数据实验
有些问题是没有历史数据可参考的,只能通过实验得到结果。而工作中的实验,又不像实验室里,可以把消费者、店铺、APP扣在玻璃罩子里隔绝外界环境,一点点测试。
因此需要结合业务流程,设计实验方法,考虑这些具体问题:
- 做抽样实验还是全量实验?
- 抽样方式、样本量如何设计?
- 实验次数、实验投入如何控制?
- 哪些影响因素要提前考虑?
- 实验对象内部特征要不要管?
能力七:输出数据报告
很多新人有疑惑:“输出数据报告也是能力?不是有模板吗?”确实,有些公司数据报告有模板,问题是怎么把报告输出给业务,并且获得业务的点赞,真的是一个能力,还是高级能力。因为数据分析结论,会直观反应业务做的好/不好,“屁股决定脑袋”的事多的很!
比如:
明明活动不达标,业务非说是“自然增长率”计算不合理
明明指标不达标,业务非说是“大环境不行,不是我没做好”
明明只是小波动,业务非逼着“深入分析0.01%差异背后的深层原因”
怎么办!很难办呀!
所以做好汇报,是个很考验综合能力的事。