数据分析师的简介
数据分析师 是数据师的一种,指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。
这是一个用数据说话的时代,也是一个依靠数据竞争的时代。目前世界500强企业中,有90%以上都建立了数据分析部门。IBM、微软、Google等知名公司都积极投资数据业务,建立数据部门,培养数据分析团队。各国政府和越来越多的企业意识到数据和信息已经成为企业的智力资产和资源,数据的分析和处理能力正在成为日益倚重的技术手段。
博主也曾经说过:得数据分析师者,得武林;得数据者,得天下。
1、网友经验之谈
经验之谈部分源自:知乎-路人甲,https://www.zhihu.com/people/sgai/posts
入行之后,才发现数据分析其实可以分为两种:一种类似产品经理、一种偏向数据挖掘,类似产品经理向更加注重业务,对业务能力要求比较高;数据挖掘向更加注重技术,对算法代码能力要求比较高。
(1)、数据分析师基本技能
数据库基础:比如SQL Server、Orcale等,我们都知道数据分析师每天都会处理海量的数据,这些数据来源于数据库,那么怎么从数据库取数据?如何建立两表、三表之间的关系?怎么取到自己想要的特定的数据?等等这些数据选择问题就是你首要考虑的问题,而这些问题都是通过SQL解决的,所以SQL是数据分析的最基础的技能。
统计学基础:数据分析的前提要对数据有感知,数据如何收集?数据整体分布是怎样的?如果有时间维度的话随着时间的变化是怎样的?数据的平均值是什么?数据的最大值最小值指什么?数据相关与回归、时间序列分析和预测等等。
语言编程基础:比如Python或者R,这一点是必备项也是加分项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。
(2)、作为一个商业数据分析师自己的理解,把数据分析师的工作日常总结为下面几个方面:
产生数据:我这里所说的产生数据,并不是说去做开发或是做数据采集。我这里所说的数据是每当业务上有新的功能点需要开发上线的时候,数据分析师需要去围绕着这些功能会产生哪些业务变化、这个功能上线的目的是什么、上线之后该如何衡量效果等一系列问题,在功能上线前做好数据的埋点、以及可以衡量最终效果的指标。这样当功能上线的时候,你可以快速的衡量业务效果。
提供数据:第一步的数据产生有方便了第二步的数据提供。提供数据可能是作为一个数据分析师每天都要做的事情,甚至有时候大半天都在做这件事情。数据需求的来源是多方的,各种业务方以及产品经理。商业数据分析师是公司业务方面的数据的出口,为了能准确的给需求方提供数据,你需要跟业务方有充分的沟通,对公司的数据维度有详细的了解。
解释数据:作为数据分析师,是不能止步于提供数据的。提供数据之余,你也要会解释数据,这些数据是怎么来的?好的数据坏的数据都需要去知道,那样才能取长补短。
探索数据:光有解释数据是不够的,因为数据分析并不是解决能看出来的问题,还要能提出发现解决一些探索性的问题。比如,给新用户怎样的激励,才能让他们的次日留存达到最佳?比方说Linkedin探索出来的让新用户拥有六个以及以上好友可以很好提高他们的留存。探索数据通常是一个长期的比较大的项目,探索数据并不存在一个标准的答案,也通常可能是几个月出不了一个好的结论。
影响数据:A/B Test是为了探索更好的方向,更受用户喜欢的功能。通过数据论证可以说服业务方听询数据分析师的意见。推送的消息文本应该怎么发?发给几个实验组看看效果;这个按钮应该设计成什么颜色,配上什么文字?多设计几套上线几个不同分组看效果。通过不断的A/B Test,数据分析师会更好的辅助产品的迭代,影响数据的产生。
(3)、数据分析师的能力认知
数据分析师的能力分为:分析能力和业务能力。其中,分析能力决定一个数据分析师的下限,业务能力决定一个数据分析师的上限。
(4)、数据分析学习的两大阶段
(4.1)、培养自己做分析的能力:最终实现,对数据的整体感知,知道什么时候该用什么图表,掌握好一些基本的算法和分析库。
第一阶段的基础是要有数据,分析能力相对来说是死板的,通常你需要学会掌握下面这些技能:
数据分析常用哪些算法?
需要用哪些库?
如何进行计算?
进行可视化,每一种图表的用途是什么?
还要学会使用工具,有两种,一种是语言编程的工具,想怎么分析就怎么分析;另一种是可视化的小工具,比如Tableau、Power BI等。
(4.2)、培养自己做业务的能力:技术不再是障碍,重点是要有自己的idea。技巧是多学、多看、多做。
我想要做什么?分析什么?
是否有数据能提供支持?把你想做的抽象成数据。
数据获取/数据清洗
开始进行分析(语言、工具)