Polars实践(2):阿里天池——淘宝用户购物行为分析

简介: Polars实践(2):阿里天池——淘宝用户购物行为分析

本期,我们继续使用Polars来对阿里天池数据集——淘宝用户行为进行分析。一、用户行为分析总览本节主要用Polars来看一下,在行为类型这一列中,4种行为的占比分别是多少?(pv 商品详情页pv,等价于点击;buy 商品购买;cart将商品加入购物车;fav 收藏商品)Polars实现代码如下:

df_type=df1.group_by('行为类型').len()df_type

ce181ddd2319ebdfe811ee33090147fd.png

用matplotlib画个饼图直观的看一下

import matplotlib.pyplot as pltplt.figure()plt.pie(df_type['len'], labels=df_type['行为类型'], autopct='%1.1f%%')plt.legend(df_type['行为类型'], loc="best")plt.show()

190957f6145df344cefe7a98c02b8fcb.png

可以看到,在整个数据集中,商品点击PV数量最多,购买行为数量占比最少。二、看看只进行了一次点击操作(PV)的用户

# 筛选出行为类型等于pv的行,即只有点击的用户filtered_df = df1.filter(pl.col("行为类型")=='pv')# 找出这些行中用户ID只进行了一次点击的客户。unique_group_values = filtered_df.group_by('用户ID').len().sort(by="len",descending=False)unique_group_values

c65bbb0e8ca99bf916a0795e28a4aeb3.png

#找出只进行了一次PV点击的用户fiopv=unique_group_values.filter(pl.col('len')==1)fiopv

a379e723e0b74502bcc570187faa0615.png

整个数据集中,共有666个用户只进行了一次点击PV操作。

三、统计哪个用户的用户行为最多

#统计每个用户ID在此期间进行了多少次行为类型操作bemax=df1.group_by('用户ID').agg(pl.col('行为类型').count())bemax

d65fdb5467fa316cb8546355523e2696.png

#排序,找出行为类型最小、最大的用户bemax.sort(by="行为类型",descending=False)

7c4c268471616a9858a9072152d5a7fb.png

用户ID为503757的用户在整个数据集中进行了848次操作,我们来看看他(她)到底都进行了哪些操作?

#筛选出最多行为类型的用户的数据,即用户ID为503757的用户
be5max=df1.filter(pl.col('用户ID')==503757)be5max

34935c582cba6265cc4d233deeecb6a6.png

来看看他(她)买东西(buy)的具体情况:

#看看操作最多的这位买家都买了些什么,都在什么时间买的be5max.filter(pl.col('行为类型')=='buy')

5f242823a1144c4b6e32d9acb5e283b0.png

这位买家集中在一天当中的10点进行操作,其中2017年12月1日同一时间一次购买了5件商品,看来是直接购物车买单结算了 本期就分析到这里,未完待续,敬请期待!

相关文章
|
5月前
|
机器学习/深度学习 算法 搜索推荐
外卖平台推荐算法的优化与实践
外卖平台推荐算法的优化与实践
|
19天前
|
存储 数据采集 数据挖掘
Polars实践(4):阿里天池——淘宝用户购物行为分析
Polars实践(4):阿里天池——淘宝用户购物行为分析
27 0
|
19天前
|
数据挖掘 大数据 API
Polars实践(1):阿里天池——淘宝用户购物行为分析
Polars实践(1):阿里天池——淘宝用户购物行为分析
32 0
|
19天前
|
Python
Polars实践(3):阿里天池——淘宝用户购物行为分析
Polars实践(3):阿里天池——淘宝用户购物行为分析
29 0
|
5月前
|
人工智能
阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
【2月更文挑战第15天】阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
578 2
阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
|
11月前
|
搜索推荐
142 推荐系统架构(淘宝和京东)
142 推荐系统架构(淘宝和京东)
167 0
|
开发者
《ClickHouse中国开发者和用户沙龙》活动现场及线上直播预约火热进行中!
ClickHouse如何帮助企业实现降本提效?在海量数据场景下ClickHouse如何落地实践?阿里云ClickHouse产品如何更好的上手及应用? 3月25日,我们不见不散!
642 0
《ClickHouse中国开发者和用户沙龙》活动现场及线上直播预约火热进行中!
|
搜索推荐 算法 前端开发
每日好店——淘宝店铺推荐系统实践
每日好店——淘宝店铺推荐系统实践
806 0
|
数据采集 自然语言处理 安全
Q&A特辑 | 电商风控实操全解答
电商风控实操全解答
238 0
Q&A特辑 | 电商风控实操全解答
|
SQL 分布式计算 数据可视化
淘宝大数据分析案例
淘宝大数据分析案例
560 0
淘宝大数据分析案例