Pandas实战(3):电商购物用户行为数据分析

简介: Pandas实战(3):电商购物用户行为数据分析

接上篇,我们继续使用Pandas对电商购物用户行为进行数据分析。

一、统计数据集中哪一天的成交额最大

dfc_max=df.groupby('invoice_date').agg({'price':'sum'})dfc_max.sort_values(by='price',ascending=False)

2e02695e678ac3ed0ad7e188b39282fb.png

数据集中,成交额最高的一天为2021年10月28日,额度在13万左右;成交额最低的一天为2022年8月20日,额度在4.8万左右。

二、统计数据集中服装类产品男女的购买情况

df_clothing=df[df['category']=='Clothing']df_clothing

cb0fde13221b53f3a0b77c36593bf137.png

统计一下男女购买者的数量

dfc_count=df_clothing['gender'].value_counts()dfc_count

cfc9722437e4cc03cd7b5fc3c03a4ee7.png

画个饼图看看:

import matplotlib.pyplot as pltplt.figure()plt.pie(dfc_count, labels=dfc_count.index, autopct='%1.1f%%')plt.show()

7618de2c3daa0b18d9e43984a99b0b1e.jpg

从服装购买量上看,男女比例在4:6左右。

三、看看化妆品的购买情况

df_cosmetics=df[df['category']=='Cosmetics']df_cosmeticscount=df_cosmetics['gender'].value_counts()df_cosmeticscount

88beced551ce29bd0119d96f81571c5e.png

画个饼图:

f6224b38bb2a1db572eefafe114e9852.png

呃,男女购买者的比例也基本上是4:6,看来这个数据集是作者精心筛选过的

四、统计服装、鞋子、化妆品三类总数的情况

df_total=df[(df['category']=='Cosmetics')|(df['category']=='Clothing')|(df['category']=='Shoes')]df_total

cd845d84998c0a7febf146a6b6672b81.png

统计一下男女购买者的数量

df_totalc=df_total['gender'].value_counts()df_totalc

005752a9bcd6c775dd55b2b3db06ecf6.png

直观的画个饼图看看

f0ebb428f6bfcd54f88e640260ef02ca.jpg

呃,三大类加起来男女购买者的数量比例依然为4:6,数据集作者用心了啊 。OK,好了,关于用Pandas对电商购物用户行为数据分析就结束了,如果感兴趣,后续,可以继续使用这个数据集来对您感兴趣的题目进行分析

相关文章
|
7天前
|
数据采集 数据可视化 数据挖掘
基于Python的数据分析与可视化实战
本文将引导读者通过Python进行数据分析和可视化,从基础的数据操作到高级的数据可视化技巧。我们将使用Pandas库处理数据,并利用Matplotlib和Seaborn库创建直观的图表。文章不仅提供代码示例,还将解释每个步骤的重要性和目的,帮助读者理解背后的逻辑。无论你是初学者还是有一定基础的开发者,这篇文章都将为你提供有价值的见解和技能。
21 0
|
13天前
|
SQL 数据采集 数据可视化
深入 Python 数据分析:高级技术与实战应用
本文系统地介绍了Python在高级数据分析中的应用,涵盖数据读取、预处理、探索及可视化等关键环节,并详细展示了聚类分析、PCA、时间序列分析等高级技术。通过实际案例,帮助读者掌握解决复杂问题的方法,提升数据分析技能。使用pandas、matplotlib、seaborn及sklearn等库,提供了丰富的代码示例,便于实践操作。
140 64
|
3天前
|
机器学习/深度学习 数据采集 算法
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
【10月更文挑战第5天】随着数据科学和机器学习领域的快速发展,处理大规模数据集的能力变得至关重要。Python凭借其强大的生态系统,尤其是NumPy、Pandas和SciPy等库的支持,在这个领域占据了重要地位。本文将深入探讨这些库如何帮助科学家和工程师高效地进行数据分析,并通过实际案例来展示它们的一些高级应用。
13 0
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
|
9天前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
20 1
|
1天前
|
供应链 监控 数据挖掘
淘宝商品详情数据接口:解锁电商数据分析新密码
在数字化时代,电商竞争激烈,精准的数据分析成为制胜关键。淘宝商品详情数据接口如同一把神奇的钥匙,为商家提供商品名称、价格、销量、评价等详细信息,助力洞察市场趋势、优化商品策略、提升运营效率。通过实时更新的数据,商家可以及时调整定价、促销和库存管理,增强竞争力。未来,该接口将带来更多智能化的数据分析工具和精准的市场预测模型,助力电商从业者在竞争中脱颖而出。
|
4天前
|
数据采集 数据可视化 数据挖掘
Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
【10月更文挑战第3天】Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
24 0
|
19天前
|
数据挖掘 Python
Pandas数据分析实战(2):2023美国财富1000强公司情况
Pandas数据分析实战(2):2023美国财富1000强公司情况
28 0
|
19天前
|
数据采集 数据挖掘 Python
Pandas数据分析实战(1):2023美国财富1000强公司情况
Pandas数据分析实战(1):2023美国财富1000强公司情况
29 0
|
2月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
52 2
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
137 4