Pandas透视表及应用(二)

简介: 这个文本是关于使用Pandas进行数据分析的教程,主要关注会员数据的处理和业务指标的计算。

Pandas透视表及应用(一)+https://developer.aliyun.com/article/1543896?spm=a2c6h.13148508.setting.33.1fa24f0eyCLrzp




整体等级分布




报表可视化






从业务角度,将会员数据拆分成线上和线下,比较每月线上线下会员的运营情况


将“会员来源”字段进行拆解,统计线上线下会员增量





各地区会销比


会销比的计算和分析会销比的作用


会销比 = 会员消费的金额 / 全部客户消费的金额


由于数据脱敏的原因,没有全部客户消费金额的数据,所以用如下方式替换


会销比 = 会员消费的订单数 / 全部销售订单数


会销比统计的是会员消费占所有销售金额的比例


通过会销比可以衡量会员的整体质量  


加载数据
custom_consume=pd.read_excel('data/会员消费报表.xlsx')
all_orders=pd.read_excel('data/全国销售订单数量表.xlsx')
custom_consume.head()
all_orders.head()


为会员消费报表添加年月列




merge连接相当于SQL的join


剔除电商数据,统计会员购买订单数量:



全部订单数




计算各地区会销比



会员连带率分析


统计订单的数量:需要对"订单号"去重,并且只要"下单"的数据,"退单"的不要



统计消费商品数量



计算连带率



会员复购率分析



上面计算的数据为所有数据的复购率,我们要统计每年的复购率,所以要先对数据进行订单日期筛选,这里我们定义一个函数




统计2018年01月~2018年12月复购率和2018年02月~2019年01月复购率


计算2018年的复购率




计算2018年02月~2019年01月的复购率



计算复购率环比


相关文章
|
4月前
|
存储 数据挖掘 数据处理
Pandas中explode()函数的应用与实战
Pandas中explode()函数的应用与实战
85 0
|
2月前
|
数据采集 机器学习/深度学习 数据处理
数据科学家的秘密武器:Pandas与NumPy高级应用实战指南
【7月更文挑战第14天】Pandas与NumPy在数据科学中扮演关键角色。Pandas的DataFrame和Series提供高效数据处理,如数据清洗、转换,而NumPy则以ndarray为基础进行数值计算和矩阵操作。两者结合,从数据预处理到数值分析,形成强大工具组合。示例展示了填充缺失值、类型转换、矩阵乘法、标准化等操作,体现其在实际项目中的协同效用。掌握这两者,能提升数据科学家的效能和分析深度。**
29 0
|
3月前
|
监控 数据可视化 数据挖掘
Pandas透视表及应用(一)
数据透视表(Pivot Table)是一种交互式的表,可以进行某些计算,如求和与计数等。所进行的计算与数据跟数据透视表中的排列有关。
|
4月前
|
机器学习/深度学习 存储 算法
Pandas中的get_dummies()函数实战应用详解
Pandas中的get_dummies()函数实战应用详解
108 1
|
4月前
|
数据采集 机器学习/深度学习 数据可视化
Pandas在数据分析中有广泛的应用场景
Pandas是数据分析利器,适用于数据清洗(处理缺失值、重复项、异常值)、探索分析(统计量、图表)、预处理(特征提取、编码、选择)、建模(线性回归、聚类等)及可视化,与Matplotlib等库配合提升效率。
38 1
|
4月前
|
索引 Python
使用Python的Pandas库进行数据透视表(pivot table)操作
使用Python Pandas进行数据透视表操作包括:安装Pandas库,导入库,创建或读取数据,如`pd.DataFrame()`或从文件读取;然后使用`pd.pivot_table()`创建透视表,指定数据框、行索引、列索引和值,例如按姓名和科目分组计算平均分;查看结果通过打印数据透视表;最后可使用`to_csv()`等方法保存到文件。这为基础步骤,可按需求调整参数实现更多功能。
198 2
|
4月前
|
数据采集 SQL 数据挖掘
Python数据分析中的Pandas库应用指南
在数据科学和分析领域,Python语言已经成为了一种非常流行的工具。本文将介绍Python中的Pandas库,该库提供了强大的数据结构和数据分析工具,使得数据处理变得更加简单高效。通过详细的示例和应用指南,读者将了解到如何使用Pandas库进行数据加载、清洗、转换和分析,从而提升数据处理的效率和准确性。
|
4月前
|
Python
Pandas进阶--map映射,分组聚合和透视pivot_table详解
Pandas进阶--map映射,分组聚合和透视pivot_table详解
|
4月前
|
数据处理 Python
Pandas在数据分析中的应用案例
使用Pandas分析销售数据,通过`read_csv`读取CSV,`groupby`按产品类别分组并应用`agg`计算类别总销售额、平均价和销售量。之后,利用`sort_values`按销售额降序排列,`head`获取前5高销售额类别。示例代码展示了Pandas在数据处理和分析中的高效性。
76 0
|
2月前
|
数据挖掘 Python
【Python】已解决:Python pandas读取Excel表格某些数值字段结果为NaN问题
【Python】已解决:Python pandas读取Excel表格某些数值字段结果为NaN问题
127 0