助力工业物联网,工业大数据之服务域:派单主题分析实现【二十九】

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 助力工业物联网,工业大数据之服务域:派单主题分析实现【二十九】

13:服务域:派单主题分析实现

  • 目标掌握派单主题的需求分析实现
  • 路径
  • step1:需求
  • step2:分析
  • 实施
  • 需求:统计不同维度下的派单主题指标的结果
字段名称 字段说明 来源
install_sumnum 安装单数量 one_make_dwb.fact_worker_order
repair_sumnum 维修单数量 one_make_dwb.fact_worker_order
remould_sumnum 巡检单数量 one_make_dwb.fact_worker_order
inspection_sumnum 改造单数量 one_make_dwb.fact_worker_order
max_wo_num 派单数最大值 one_make_dwb.fact_worker_order
min_wo_num 派单数最小值 one_make_dwb.fact_worker_order
avg_wo_num 派单数平均值 one_make_dwb.fact_worker_order
call_srv_user 呼叫中心派单人 one_make_dwb.fact_call_service
max_dispatch_cnt 呼叫中心最大派单 one_make_dwb.fact_call_service
min_dispatch_cnt 呼叫中心最小派单 one_make_dwb.fact_call_service
avg_dispatch_cnt 呼叫中心平均派单 one_make_dwb.fact_call_service
people_wo_num 派单平均值 one_make_dwb.fact_worker_order
srv_reps_duration 派单响应时长 one_make_dwb.fact_worker_order
srv_duration 服务时长 one_make_dwb.fact_worker_order
pepople_sumnum 工单人数 one_make_dwb.fact_worker_order
dws_day string 日期维度-按天 one_make_dws.dim_date
dws_week string 日期维度-按周 one_make_dws.dim_date
dws_month string 日期维度-按月 one_make_dws.dim_date
orgname 组织机构-回访人员所属部门 one_make_dws.dim_emporg
posiname 组织机构-回访人员所属岗位 one_make_dws.dim_emporg
posiname 组织机构-回访人员名称 one_make_dws.dim_emporg
oil_type string 油站类型 one_make_dws.dim_oilstation
oil_province 油站所属省 one_make_dws.dim_oilstation
oil_city string 油站所属市 one_make_dws.dim_oilstation
oil_county string 油站所属区 one_make_dws.dim_oilstation
customer_classify 客户类型 one_make_dws.dim_oilstation
customer_province 客户所属省 one_make_dws.dim_oilstation

  • 分析
  • 指标
  • 安装单数量、维修单数量、改造单数量、巡检单数量
  • 最大派单数、最小派单数、平均派单数
  • 工单主题事实表
  • 呼叫中心派单人、呼叫中心最大派单、呼叫中心最小派单、呼叫中心平均派单
  • 呼叫中心
  • 派单平均值、派单响应时长、服务时长、工单人数
  • 维度
  • 日期维度:天、周、月
  • 组织机构维度:人员部门、人员岗位、人员姓名
  • 油站维度:类型、省份、城市、区域
  • 客户维度:类型、省份
  • 数据
  • 事实表
  • fact_call_service:呼叫中心事务事实表
select
    userid,--受理人员id
    dispatch_cnt,--派工数量
    id,--呼叫受理id
    oil_station_id, --油站id
    dt --日期
from fact_call_service;
  • fact_worker_order:工单事务事实表
select
    callaccept_id,--呼叫受理id
    install_num,--安装数量
    repair_num,--维修数量
    remould_num,--改造数量
    inspection_num,--巡检数量
    wo_num, --工单数量
    people_num, --工单人数
    repair_service_duration,--报修响应时长
    service_total_duration --服务总时长
from fact_worker_order;
  • 维度表
  • dim_oilstation:油站维度表
select
    id,--油站id
    company_name,--公司名称
    province_name,--省份名称
    city_name,--城市名称
    county_name,--区域名称
    customer_classify_name,--客户名称
    customer_province_name--客户省份
from dim_oilstation;
  • dim_date:时间维度表
select
    date_id,--天
    week_in_year_id,--周
    year_month_id --月
from dim_date;
  • dim_emporg:组织机构维度
select      
empid,--人员id      
orgname,--部门名称      
posiname,--岗位名称      
empname --员工名称  
from dim_emporg;
  • 实现
  • 建表
drop table if exists one_make_st.subj_dispatch;
create table if not exists one_make_st.subj_dispatch(
    install_sumnum int comment '安装单数量'
    ,repair_sumnum int comment '维修单数量'
    ,remould_sumnum int comment '改造单数量'
    ,inspection_sumnum int comment '巡检单数量'
    ,max_wo_num int comment '派单数最大值'
    ,min_wo_num int comment '派单数最小值'
    ,avg_wo_num decimal(20, 1) comment '派单数平均值'
    ,call_srv_user int comment '呼叫中心派单人'
    ,max_dispatch_cnt int comment '呼叫中心最大派单'
    ,min_dispatch_cnt int comment '呼叫中心最小派单'
    ,avg_dispatch_cnt decimal(20, 1) comment '呼叫中心平均派单'
    ,people_wo_num decimal(20, 1) comment '派单平均值'
    ,srv_reps_duration int comment '派单响应时长'
    ,srv_duration int comment '服务时长'
    ,pepople_sumnum int comment '工单人数'
    ,dws_day string comment '日期维度-按天'
    ,dws_week string comment '日期维度-按周'
    ,dws_month string comment '日期维度-按月'
    ,orgname string comment '组织机构维度-回访人员所属部门'
    ,posiname string comment '组织机构维度-回访人员所属岗位'
    ,empname string comment '组织机构维度-回访人员名称'
    ,oil_type string comment '油站维度-油站类型'
    ,oil_province string comment '油站维度-油站所属省'
    ,oil_city string comment '油站维度-油站所属市'
    ,oil_county string comment '油站维度-油站所属区'
    ,customer_classify string comment '客户维度-客户类型'
    ,customer_province string comment '客户维度-客户所属省'
) comment '派单主题表'
partitioned by (month String, week String, day String)
stored as orc
location '/data/dw/st/one_make/subj_dispatch'
;
  • 构建
insert overwrite table one_make_st.subj_dispatch partition(month = '202101', week='2021W1', day='20210101')
select
  sum(fwo.install_num) install_sumnum,                       --安装单数量
  sum(fwo.repair_num) repair_sumnum,                         --维修单数量
  sum(fwo.remould_num) remould_sumnum,                       --改造单数量
  sum(fwo.inspection_num) inspection_sumnum,                 --巡检单数量
    max(fwo.wo_num) max_wo_num,                                --最大派单数
  min(fwo.wo_num) min_wo_num,                                --最小派单数
  avg(fwo.wo_num) avg_wo_num,                                --平均派单数
  sum(fcs.userid) call_srv_user,                             --呼叫中心派单人
  max(fcs.dispatch_cnt) max_dispatch_cnt,                    --呼叫中心最大派单
    min(fcs.dispatch_cnt) min_dispatch_cnt,                    --呼叫中心最小派单
  avg(fcs.dispatch_cnt) avg_dispatch_cnt,                    --呼叫中心平均派单
  sum(fwo.wo_num) / sum(fwo.people_num) people_wo_num,       --派单平均值
    sum(fwo.repair_service_duration) srv_reps_duration,        --派单响应时长
  sum(fwo.service_total_duration) srv_duration,              --服务时长
  sum(fwo.people_num) pepople_sumnum,                        --工单人数
    dd.date_id dws_day,                                        --日期日
  dd.week_in_year_id dws_week,                               --日期周
  dd.year_month_id dws_month,                                --日期月
  emp.orgname,                                               --组织机构人员部门
  emp.posiname,                                              --组织机构人员岗位
  emp.empname,                                               --组织机构人员名称
  dimoil.company_name oil_type,                              --油站类型
    dimoil.province_name oil_province,                         --油站省份
  dimoil.city_name oil_city,                                 --油站城市
  dimoil.county_name oil_county,                             --油站区域
  dimoil.customer_classify_name customer_classify,           --客户类型
    dimoil.customer_province_name customer_province            --客户省份
--呼叫中心事务事实表
from one_make_dwb.fact_call_service fcs
--关联工单事实表
left join one_make_dwb.fact_worker_order fwo on fcs.id = fwo.callaccept_id
--关联组织机构维度表
left join one_make_dws.dim_emporg emp on fcs.userid = emp.empid
--关联日期维度表
left join one_make_dws.dim_date dd on fcs.dt = dd.date_id
--关联油站维度表
left join one_make_dws.dim_oilstation dimoil on fcs.oil_station_id = dimoil.id
where dd.year_month_id = '202101'and dd.week_in_year_id = '2021W1' and  dd.date_id = '20210101'
group by dd.date_id, dd.week_in_year_id, dd.year_month_id, emp.orgname, emp.posiname, emp.empname, dimoil.company_name, dimoil.province_name,
         dimoil.city_name, dimoil.county_name, dimoil.customer_classify_name, dimoil.customer_province_name
;
  • 小结
  • 掌握派单主题的需求分析及实现

14:服务域:费用主题分析

  • 目标掌握费用主题的需求分析
  • 路径
  • step1:需求
  • step2:分析
  • 实施
  • 需求:统计不同维度下的费用主题指标的结果
字段名称 字段说明 来源
install_money 安装费用 one_make_dwb.fact_srv_install
max_install_money 最大安装费用 one_make_dwb.fact_srv_install
min_install_money 最小安装费用 one_make_dwb.fact_srv_install
avg_install_money 平均安装费用 one_make_dwb.fact_srv_install
sumbiz_trip_money 外出差旅费用金额总计 one_make_dwb.fact_trvl_exp
sumin_city_traffic_money 市内交通费用金额总计 one_make_dwb.fact_trvl_exp
sumhotel_money 住宿费费用金额总计 one_make_dwb.fact_trvl_exp
sumfars_money 车船费用金额总计 one_make_dwb.fact_trvl_exp
sumsubsidy_money 补助费用金额总计 one_make_dwb.fact_trvl_exp
sumroad_toll_money 过桥过路费用金额总计 one_make_dwb.fact_trvl_exp
sumoil_money 油费金额总计 one_make_dwb.fact_trvl_exp
exp_item_total 差旅费用扣款明细总计 one_make_dwb.fact_regular_exp
actual_total_money 差旅费用总额统计 one_make_dwb.fact_trvl_exp
sum_secondary_money 差旅费用二阶段扣款总计 one_make_dwb.fact_trvl_exp
sum_third_money 差旅费用三阶段扣款总计 one_make_dwb.fact_trvl_exp
max_secondary_money 差旅费用二阶段最大扣款总计 one_make_dwb.fact_trvl_exp
max_third_money 差旅费用三阶段最大扣款总计 one_make_dwb.fact_trvl_exp
sum_srv_user 报销人员总数量 one_make_dwb.fact_trvl_exp
max_srv_user 报销人员最大数量 one_make_dwb.fact_trvl_exp
min_srv_user 报销人员最小数量 one_make_dwb.fact_trvl_exp
avg_srv_user 报销人员平均数量 one_make_dwb.fact_trvl_exp
dws_day string 日期维度-按天 one_make_dws.dim_date
dws_week string 日期维度-按周 one_make_dws.dim_date
dws_month string 日期维度-按月 one_make_dws.dim_date
oil_type string 油站类型 one_make_dws.dim_oilstation
oil_province 油站所属省 one_make_dws.dim_oilstation
oil_city string 油站所属市 one_make_dws.dim_oilstation
oil_county string 油站所属区 one_make_dws.dim_oilstation
customer_classify 客户类型 one_make_dws.dim_oilstation
customer_province 客户所属省 one_make_dws.dim_oilstation

  • 分析
  • 指标
  • 安装费用、最大安装费用、最小安装费用、平均安装费用
  • 外出差旅费用金额总计、市内交通费用金额总计、住宿费用金额总计、车船费用金额总计、补助费用金额总计、过桥过路费用金额总计、油费金额总计
  • 差旅费用扣款明细总计、差旅费用总额统计、差旅费用二阶段扣款总计、差旅费用三阶段扣款总计、差旅费用二阶段最大扣款总计、差旅费用三阶段最大扣款总计
  • 报销人员数量、报销人员最大数量、报销人员最小数量、报销人员平均数量
  • 维度
  • 日期维度:天、周、月
  • 油站维度:类型、省份、城市、区域
  • 客户维度:类型、省份
  • 数据
  • 事实表
  • fact_trvl_exp:差旅事务事实表
select
    biz_trip_money,--外出差旅费用
    in_city_traffic_money,--市内交通费用
    hotel_money,--住宿费用
    fars_money,--车船费用
    subsidy_money,--补助费用
    road_toll_money,--过桥过路费用
    oil_money,--油费
    secondary_money,--二单补助费用总计
    third_money, --三单补助费用总计
    actual_total_money,--费用报销总计
    ss_id,--服务网点id
    srv_user_id,--工程师id
    dt --日期
from fact_trvl_exp;
  • fact_regular_exp:报销事务事实表
select
    ss_id,--服务网点id
    srv_user_id,--工程师id
    exp_item_name --费用项目名称
from fact_regular_exp;
  • fact_srv_install:安装事务事实表
select
    ss_id,--服务网点id
    exp_device_money,--安装费用
    os_id --油站id
from fact_srv_install;
  • 维度表
  • dim_oilstation:油站维度表
select
      id,--油站id
      company_name,--公司名称
      province_name,--省份名称
      city_name,--城市名称
      county_name,--区域名称
      customer_classify_name,--客户名称
      customer_province_name--客户省份
  from dim_oilstation;
  • dim_date:时间维度表
select
      date_id,--天
      week_in_year_id,--周
      year_month_id --月
  from dim_date;
  • 小结
  • 掌握费用主题的需求分析

15:服务域:费用主题实现

  • 目标实现费用主题表的维度指标构建
  • 实施
  • 建表
drop table if exists one_make_st.subj_expense;
create table if not exists one_make_st.subj_expense(
    install_money decimal(20,1) comment '安装费用'
    ,max_install_money decimal(20,1) comment '最大安装费用'
    ,min_install_money decimal(20,1) comment '最小安装费用'
    ,avg_install_money decimal(20,1) comment '平均安装费用'
    ,sumbiz_trip_money decimal(20, 1) comment '外出差旅费用金额总计'
    ,sumin_city_traffic_money decimal(20, 1) comment '市内交通费用金额总计'
    ,sumhotel_money decimal(20, 1) comment '住宿费费用金额总计'
    ,sumfars_money decimal(20, 1) comment '车船费用金额总计'
    ,sumsubsidy_money decimal(20, 1) comment '补助费用金额总计'
    ,sumroad_toll_money decimal(20, 1) comment '过桥过路费用金额总计'
    ,sumoil_money decimal(20, 1) comment '油费金额总计'
    ,exp_item_total int comment '差旅费用扣款明细总计'
    ,actual_total_money decimal(20, 1) comment '差旅费用总额统计'
    ,sum_secondary_money decimal(20, 1) comment '差旅费用二阶段扣款总计'
    ,sum_third_money decimal(20, 1) comment '差旅费用三阶段扣款总计'
    ,max_secondary_money decimal(20, 1) comment '差旅费用二阶段最大扣款总计'
    ,max_third_money decimal(20, 1) comment '差旅费用三阶段最大扣款总计'
    ,sum_srv_user int comment '报销人员总数量'
    ,max_srv_user int comment '报销人员最大数量'
    ,min_srv_user int comment '报销人员最小数量'
    ,avg_srv_user int comment '报销人员平均数量'
    ,dws_day string comment '日期维度-按天'
    ,dws_week string comment '日期维度-按周'
    ,dws_month string comment '日期维度-按月'
    ,oil_type string comment '油站维度-油站类型'
    ,oil_province string comment '油站维度-油站所属省'
    ,oil_city string comment '油站维度-油站所属市'
    ,oil_county string comment '油站维度-油站所属区'
    ,customer_classify string comment '客户维度-客户类型'
    ,customer_province string comment '客户维度-客户所属省'
) comment '费用主题表'
partitioned by (month String, week String, day String)
stored as orc
location '/data/dw/st/one_make/subj_expense'
;
  • 构建
insert overwrite table one_make_st.subj_expense partition(month = '202101', week='2021W1', day='20210101')
select
  sum(install.exp_device_money) install_money,               --安装费用
  max(install.exp_device_money) max_install_money,           --最大安装费用
  min(install.exp_device_money) min_install_money,           --最小安装费用
    avg(install.exp_device_money) avg_install_money,           --平均安装费用
  sum(fte.biz_trip_money) sumbiz_trip_money,                 --外出差旅费用金额总计
  sum(fte.in_city_traffic_money) sumin_city_traffic_money,   --市内交通费用金额总计
    sum(fte.hotel_money) sumhotel_money,                       --住宿费用金额总计
  sum(fte.fars_money) sumfars_money,                         --车船费用金额总计
  sum(fte.subsidy_money) sumsubsidy_money,                   --补助费用金额总计
  sum(fte.road_toll_money) sumroad_toll_money,               --过桥过路费用金额总计
    sum(fte.oil_money) sumoil_money,                           --油费金额总计
  count(distinct fre.exp_item_name) exp_item_total,          --差旅费用扣款明细总计
  sum(fte.actual_total_money) actual_total_money,            --差旅费用总额统计
    sum(fte.secondary_money) sum_secondary_money,              --差旅费用二阶段扣款总计
  sum(fte.third_money) sum_third_money,                      --差旅费用三阶段扣款总计
  max(fte.secondary_money) max_secondary_money,              --差旅费用二阶段最大扣款总计
  max(fte.third_money) max_third_money,                      --差旅费用三阶段最大扣款总计
    sum(size(split(fre.srv_user_id,','))) sum_srv_user,        --报销人员数量
  max(size(split(fre.srv_user_id,','))) max_srv_user,        --报销人员最大数量
    min(size(split(fre.srv_user_id,','))) min_srv_user,        --报销人员最小数量
  avg(size(split(fre.srv_user_id,','))) avg_srv_user,        --报销人员平均数量
    dd.date_id dws_day,                                        --日期天
  dd.week_in_year_id dws_week,                               --日期周
  dd.year_month_id dws_month,                                --日期月
  dimoil.company_name oil_type,                              --油站类型
  dimoil.province_name oil_province,                         --油站省份
    dimoil.city_name oil_city,                                 --油站城市
  dimoil.county_name oil_county,                             --油站区域
  dimoil.customer_classify_name customer_classify,           --客户类型
  dimoil.customer_province_name customer_province            --客户省份
--差旅事务事实表
from one_make_dwb.fact_trvl_exp fte
--安装事务事实表
left join one_make_dwb.fact_srv_install install on fte.ss_id = install.ss_id
--报销事务事实表
left join one_make_dwb.fact_regular_exp  fre on fte.srv_user_id = fre.srv_user_id
--关联日期维度表
left join one_make_dws.dim_date dd on fte.dt = dd.date_id
--关联油站维度表
left join one_make_dws.dim_oilstation dimoil on install.os_id = dimoil.id
where dd.year_month_id = '202101'and dd.week_in_year_id = '2021W1' and  dd.date_id = '20210101'
group by inst_type_id, dd.date_id, dd.week_in_year_id, dd.year_month_id,  dimoil.company_name, dimoil.province_name, dimoil.city_name, dimoil.county_name,
         dimoil.customer_classify_name, dimoil.customer_province_name
;
  • 小结
  • 实现费用主题表的维度指标构建


目录
相关文章
|
18天前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
69 2
|
8天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
27 4
|
9天前
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
65 5
|
21天前
|
存储 监控 数据挖掘
【Clikhouse 探秘】ClickHouse 物化视图:加速大数据分析的新利器
ClickHouse 的物化视图是一种特殊表,通过预先计算并存储查询结果,显著提高查询性能,减少资源消耗,适用于实时报表、日志分析、用户行为分析、金融数据分析和物联网数据分析等场景。物化视图的创建、数据插入、更新和一致性保证通过事务机制实现。
86 14
|
26天前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
77 2
|
28天前
|
数据采集 机器学习/深度学习 搜索推荐
大数据与社交媒体:用户行为分析
【10月更文挑战第31天】在数字化时代,社交媒体成为人们生活的重要部分,大数据技术的发展使其用户行为分析成为企业理解用户需求、优化产品设计和提升用户体验的关键手段。本文探讨了大数据在社交媒体用户行为分析中的应用,包括用户画像构建、情感分析、行为路径分析和社交网络分析,以及面临的挑战与机遇。
|
28天前
|
机器学习/深度学习 搜索推荐 大数据
大数据与教育:学生表现分析的工具
【10月更文挑战第31天】在数字化时代,大数据成为改善教育质量的重要工具。本文探讨了大数据在学生表现分析中的应用,介绍学习管理系统、智能评估系统、情感分析技术和学习路径优化等工具,帮助教育者更好地理解学生需求,制定个性化教学策略,提升教学效果。尽管面临数据隐私等挑战,大数据仍为教育创新带来巨大机遇。
|
16天前
|
存储 安全 物联网
政府在推动物联网技术标准和规范的统一方面可以发挥哪些作用?
政府在推动物联网技术标准和规范的统一方面可以发挥哪些作用?
88 50
|
16天前
|
安全 物联网 物联网安全
制定统一的物联网技术标准和规范的难点有哪些?
制定统一的物联网技术标准和规范的难点有哪些?
30 2
|
14天前
|
供应链 物联网 区块链
探索未来技术潮流:区块链、物联网、虚拟现实的融合与创新
【10月更文挑战第41天】随着科技的不断进步,新技术如区块链、物联网、虚拟现实等正在逐步渗透到我们的日常生活中。本文将深入探讨这些技术的发展趋势和应用场景,以及它们如何相互融合,共同推动社会的进步。我们将通过具体的代码示例,展示这些技术在实际应用中的潜力和价值。无论你是科技爱好者,还是对未来充满好奇的探索者,这篇文章都将为你打开一扇通往未来的窗口。
96 56