数据分析师7大技能:构造标签

简介: 上期分享了数据分析师必备技能:构建指标体系。这次分享一个和指标体系同等重要的技能:构造标签(俗称:打标签)。打标签能力,是区分真数据分析师和sqlboy 的重要能力

一、什么是标签?


标签是对事物的概要性描述。就像商品标签上会写商品分类、主要原料一样。虽然一件商品有很多属性,但是我们只通过几个有限的标签,就能锁定我们想要的商品,这就是标签的作用。


二、有哪些标签?


从复杂程度上看,标签有四类:


1、事实型标签比如商品的颜色、人的性别。这些是事实描述,可以直接拿来用。


2、规则型标签比如把“消费1000元以上”定义为:高消费群体。规则类标签,往往是基于一个数据指标,然后根据特定的规则进行分类。


3、复合型标签比如“高富帅”,就是一个典型复合型标签,它基于N个指标,进行综合计算,最后得出一个标签结果。


4、预测型标签注意,以上三类标签,用的都是已经发生的数据进行计算。预测型标签则是对未来情况的估计。可以用算法进行预测,也能人工预测。比如对用户进行分类,然后打个标签“预计流失用户”,就是指该用户会在未来XX时间内流失掉。


这四类标签的复杂程度是不同的:预测型>复合型>规则型>事实型。相应的打标签的难度也不一样。

三、要怎么打标签?


打标签是个通俗说法,它指的是生产标签的过程。如果是简单的事实型标签,则直接拖过来用即可。其他三类,都得经过打标签的动作,越复杂的标签,生产起来越麻烦。


打标签有四个标准步骤。


  • 明确打标签的对象
  • 明确标签的用途
  • 明确标签规则
  • 明确标签的名称


举个最简单的例子:小熊妹还没有男朋友,我想找个高富帅。


高富帅,就是个复合型标签,按四步走:


1、打标签对象:男人,活的


2、明确用途:选个潜在蓝盆友


3、明确规则:这是最复杂的一步,因为高富帅有三个维度。首先得一个维度一个维度,单独讲清楚,然后再想办法综合。


这里,高相对容易,看身高然后给个标准即可。帅,也相对容易,看到照片自己觉得还行,手工打个标签即可。富,就很纠结了。有的人挣得多,可也花得多呀。不能光看收入,还得看负债。这样,先对三个维度各自打标签,再进行综合(如下图)。


image.png


看起来综合评分似乎更科学,但实际决策时候并不是!比如我,看到帅哥就走不动道了,管他富不富呢。综合评分有可能选出来平庸的个体,这个要注意哦。


4、明确标签的名称:高富帅、非高富帅

搞掂!


可以看出,在生产标签的过程中,明确规则是最麻烦的一步。但实际上,麻烦不限于此。


四、打标签,难在哪?


看完上边的小例子,很多人会觉得:“打标签很简单呀,我一个上午能打1000个出来”。如果只是往数据库里添加1000个新字段,确实很容易。


但是,这1000个字段:


  • 有几个能被业务部门用起来?
  • 用完以后能提升业务表现?
  • 还有多少业务想要的标签,没有在其中?


这才是真正的难题。


反正我是见过,供应商傻乎乎的打了几百个标签,结果除了上线汇报ppt外,业务部门看都不看一眼的,更不要提用了。


一个好的标签,一定是:


  • 业务高频使用
  • 指向明确动作
  • 产生明显效果


就像小熊妹一听人介绍“高富帅”,就会顶着周五熬夜煲剧的黑眼圈起床化妆俩小时出门一样。这才是高频使用,有驱动力,产生明显效果的标签!


肯定有小伙伴问,业务上有没有这种标签,当然有,比如我个人很喜欢的:促销敏感型用户(是/否),这个标签。专门区分:没有促销不买,有促销高概率买的薅羊毛体制用户。拿来解释日常消费转化率,事前预计活动效果,事后复盘达成情况,都好用(先卖个关子,之后专门分享这个)。



实际业务问题经常很复杂,很难用一个标签描述情况,因此需要围绕一个业务场景。构造若干个标签,形成标签体系,驱动业务工作。今天的分享就到这里啦,喜欢的话,记得点赞、转发、在看,支持下小熊妹哦,谢谢大家。下一篇我们来分享:七大技能之如何构造标签体系,敬请期待。

相关文章
|
2月前
|
机器学习/深度学习 数据挖掘 TensorFlow
解锁Python数据分析新技能,TensorFlow&PyTorch双引擎驱动深度学习实战盛宴
在数据驱动时代,Python凭借简洁的语法和强大的库支持,成为数据分析与机器学习的首选语言。Pandas和NumPy是Python数据分析的基础,前者提供高效的数据处理工具,后者则支持科学计算。TensorFlow与PyTorch作为深度学习领域的两大框架,助力数据科学家构建复杂神经网络,挖掘数据深层价值。通过Python打下的坚实基础,结合TensorFlow和PyTorch的强大功能,我们能在数据科学领域探索无限可能,解决复杂问题并推动科研进步。
58 0
|
3月前
|
数据采集 数据可视化 数据挖掘
如何提升个人数据分析技能?
【8月更文挑战第7天】如何提升个人数据分析技能?
59 4
|
4月前
|
机器学习/深度学习 数据挖掘 TensorFlow
解锁Python数据分析新技能,TensorFlow&PyTorch双引擎驱动深度学习实战盛宴
【7月更文挑战第31天】在数据驱动时代,Python凭借其简洁性与强大的库支持,成为数据分析与机器学习的首选语言。**数据分析基础**从Pandas和NumPy开始,Pandas简化了数据处理和清洗,NumPy支持高效的数学运算。例如,加载并清洗CSV数据、计算总销售额等。
58 2
|
3月前
|
数据采集 数据挖掘 数据处理
解锁Python数据分析新技能!Pandas实战学习,让你的数据处理能力瞬间飙升!
【8月更文挑战第22天】Python中的Pandas库简化了数据分析工作。本文通过分析一个金融公司的投资数据文件“investment_data.csv”,介绍了Pandas的基础及高级功能。首先读取并检查数据,包括显示前几行、列名、形状和数据类型。随后进行数据清洗,移除缺失值与重复项。接着转换日期格式,并计算投资收益。最后通过分组计算平均投资回报率,展示了Pandas在数据处理与分析中的强大能力。
42 0
|
4月前
|
机器学习/深度学习 数据可视化 数据挖掘
职场新技能:Python数据分析,你掌握了吗?
职场新技能:Python数据分析,你掌握了吗?
44 0
|
5月前
|
机器学习/深度学习 数据可视化 算法
探索MATLAB世界:掌握基础知识与实用技能(1. MATLAB环境与基本操作 2. 数据类型与变量 3. 条件与循环,1. 数据分析与统计 2. 图像处理与计算机视觉 3. 信号处理与控制系统)
探索MATLAB世界:掌握基础知识与实用技能(1. MATLAB环境与基本操作 2. 数据类型与变量 3. 条件与循环,1. 数据分析与统计 2. 图像处理与计算机视觉 3. 信号处理与控制系统)
51 0
|
11月前
|
机器学习/深度学习 自然语言处理 算法
机器学习基础:Python数据分析的必备技能
机器学习基础:Python数据分析的必备技能
114 2
|
机器学习/深度学习 数据可视化 数据挖掘
第四届“泰迪杯”数据分析技能赛-赛题A:《通讯产品销售和盈利能力分析》报告
第四届“泰迪杯”数据分析技能赛-赛题A:《通讯产品销售和盈利能力分析》报告
746 0
|
机器学习/深度学习 人工智能 算法
Python编程入门基础及高级技能、Web开发、数据分析和机器学习与人工智能
Python编程入门基础及高级技能、Web开发、数据分析和机器学习与人工智能
175 0
|
机器学习/深度学习 数据挖掘 API
数据分析必学技能:混淆矩阵原理详解,Python调用实战
数据分析必学技能:混淆矩阵原理详解,Python调用实战