电商项目之用户交易宽表分析|学习笔记

简介: 快速学习电商项目之用户交易宽表分析

开发者学堂课程【新电商大数据平台2020最新课程电商项目之用户交易宽表分析】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/640/detail/10545


电商项目之用户交易宽表分析

 

用户交易宽表分析

上节讲到用户关注表,通过公共维度实现了数据的聚合,为之后内容做准备。接着我们来讲解用户交易宽表。

那么用户交易的宽表我们应该去哪里寻找?

应该在交易主体域。首先看我们要求的值如用户 id、地区编码、订单数量、订单金额、订单运费金额、订单优惠金额、产生时间。

createexternaltableifnotexists dws_nshop.dws_nshop_user_orders(

user_id string comment '用户id',

area_code string comment '地区编码',

orders_count int comment'订单数量',

orders_pay DECIMAL (10,1) comment '订单金额',

orders_shipping DECIMAL(10,1) comment'订单运费金额',

orders_district DECIMAL(10,1)comment '订单优惠金额',

ct bigint comment '产生时间’

) partitioned by (bdp_day string)

stored as parquet

location '/data/nshop/dws/user/dws_nshop_user_orders/ '

这些都在交易订单明细流水表中,它都是在交易主体域下,

如图

image.png

那么现在就首先需要有交易订单明细流水表

dwd_nshop.dwd_nshop_orders_details,该表中有订单 id,也有用户 id,但是在这里取值时,尽量不要取customer_id。

用户交易宽表中的地区编码不存在,需要到用户基本信息表中查找,地区编码就是下图中的所在地区customer_natives string COMMENT

image.png

所以可以修改一下用户交易宽表

customer_natives string comment '地区编码'

此处地区编码可加可不加,但是此处取到就需要加,另外在用户基本信息表中取不到地区编码,它存在用户行为日志表中,所以在写用户交易宽表时写为所在区域。

即 customer_natives string comment '所在区域'

接下来来取值,现在用到的表中有用户基本信息表,订单明细流水表中没有所在地区,需要到用户基本信息表中寻找,就需要将两者的用户 id 连接才能取到。

其它的例如订单数量可以去求对应的 count,可以对 order 进行 count,再对用户进行分组,因为一个用户可能有多个订单。

订单金额运费金额优惠金额等等在交易订单明细流水表中已经存在,直接 sum 就可以。

相关文章
|
监控 开发者
网站流量日志分析—数据入库—宽表、窄表由来概述|学习笔记
快速学习网站流量日志分析—数据入库—宽表、窄表由来概述
469 0
网站流量日志分析—数据入库—宽表、窄表由来概述|学习笔记
|
SQL 监控 数据库
网站流量日志分析—数据入库—宽表具体表现1—时间拓宽|学习笔记
快速学习网站流量日志分析—数据入库—宽表具体表现1—时间拓宽
375 0
网站流量日志分析—数据入库—宽表具体表现1—时间拓宽|学习笔记
|
SQL 监控 HIVE
网站流量日志分析--数据入库--宽表具体实现2—解析 url|学习笔记
快速学习网站流量日志分析--数据入库--宽表具体实现2—解析 url
270 0
网站流量日志分析--数据入库--宽表具体实现2—解析 url|学习笔记
|
SQL 大数据 数据处理
电商项目之用户交易宽表 SQL 实现|学习笔记
快速学习电商项目之用户交易宽表 SQL 实现
电商项目之用户交易宽表 SQL 实现|学习笔记
|
SQL 大数据 开发者
电商项目之商家用户交互记录宽表总结|学习笔记
快速学习电商项目之商家用户交互记录宽表总结
电商项目之商家用户交互记录宽表总结|学习笔记
|
大数据 开发者
电商项目之商家用户交互记录宽表分析|学习笔记
快速学习电商项目之商家用户交互记录宽表分析
电商项目之商家用户交互记录宽表分析|学习笔记
|
12月前
|
SQL 存储 运维
从建模到运维:联犀如何完美融入时序数据库 TDengine 实现物联网数据流畅管理
本篇文章是“2024,我想和 TDengine 谈谈”征文活动的三等奖作品。文章从一个具体的业务场景出发,分析了企业在面对海量时序数据时的挑战,并提出了利用 TDengine 高效处理和存储数据的方法,帮助企业解决在数据采集、存储、分析等方面的痛点。通过这篇文章,作者不仅展示了自己对数据处理技术的理解,还进一步阐释了时序数据库在行业中的潜力与应用价值,为读者提供了很多实际的操作思路和技术选型的参考。
368 1
|
存储 SQL 多模数据库
多模数据库Lindorm再升级:对接Dataphin,打通数据治理“最后一公里”
Lindorm通过与Dataphin的深度整合,进一步解决了数据集成和数据治理的问题,为企业提供更加高效和更具性价比的方案。
多模数据库Lindorm再升级:对接Dataphin,打通数据治理“最后一公里”
|
数据采集 安全 API
DataphinV4.1大升级: 支持Lindorm开启高性价比数据治理,迎来“公共云半托管”云上自助新模式
Dataphin 是阿里巴巴旗下的一个智能数据建设与治理平台,旨在帮助企业构建高效、可靠、安全的数据资产。在V4.1版本升级中,Dataphin 引入了Lindorm等多项新功能,并开启公共云半托管模式,优化代码搜索,为用户提供更加高效、灵活、安全的数据管理和运营环境,提升用户体验,促进企业数据资产的建设和价值挖掘。
2061 3
DataphinV4.1大升级: 支持Lindorm开启高性价比数据治理,迎来“公共云半托管”云上自助新模式
|
安全 数据管理
DataphinV4.1大升级:支持Lindorm开启高性价比数据治理,迎来“公共云半托管”云上自助新模式
DataphinV4.1大升级:支持Lindorm开启高性价比数据治理,迎来“公共云半托管”云上自助新模式
264 3

推荐镜像

更多