文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

根据实时数据处理架构和数据仓库分层的设计，面向零售业务的实时数仓可以分为以下哪几个流程？

根据实时数据处理架构和数据仓库分层的设计，面向零售业务的实时数仓可以分为以下哪几个流程？

展开

收起

游客lmkkns5ck6auu 2022-08-31 11:14:24 937 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客c3gxxcx6cqeyo

首先是构建 ODS 层数据，实时采集客户信息表、业务流水表、渠道表等相关基础表的 CDC 日志。每个业务库的数据表对应接入到一个 Kafka 的 topic 中建立实时数仓的 ODS 层； • 其次是 DWD 层的数据建模，创建 Flink 任务消费 ODS 层的 Kafka 消息，进行数据清洗，过滤、脱敏、关联转换等处理。同时以客户账户粒度进行数据合流，借助离线维表进行扩围操作，以获得账户粒度的明细表，实现 DWD 层的建立； • 之后是 DWS 层的数据建模，基于 DWD 层的数据进行汇总，通过分析业务需求，将 DWD 层的数据按照主题进行划分，汇总出渠道服务主题宽表、业务部运营主题宽表、交易产品主题宽表等公共指标宽表，建立 DWS 层； • 最后根据实际业务需求，计算业务指标建立 ADS 层。对于一部分用户账户粒度的业务指标，可通过 DWD 层的明细直接计算得到，部分粗粒度的业务指标比如 APP 渠道服务客户人数、投顾产品阅读人数等，可以通过 DWS 层计算获得。最终计算结果接入到数据网关将数据统一提供给下游系统或通过 BI 系统展示。

以上内容摘自《Apache Flink 案例集（2022版）》电子书，点击https://developer.aliyun.com/ebook/download/7718 可下载完整版

2022-08-31 13:18:08

赞同展开评论

问答分类：

数据处理实时计算 Flink版实时数仓 Hologres

问答标签：

数据仓库云原生数据仓库AnalyticDB MySQL版数据仓库分层架构流程架构云原生数据仓库AnalyticDB MySQL版架构分层

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

分层架构设计中严格型与松散型的区别是什么？

270

1

0

阿里云 EMR 如何推进客户湖仓一体架构的建设？

301

2

0

在数仓架构中，我们通常将数据分为哪几个层次进行管理？

293

2

0

快手实时数仓保障体系架构的正向保障思路是什么？

184

1

0

小米APP近实时数仓的架构中，日志数据是如何处理的？

209

1

0

Delta Lake 如何保证湖仓架构的可靠性、安全性和高性能？

176

1

0

最早的数仓架构是基于什么设计的？它有哪些优点和局限性？

174

1

0

为什么业务通常需要维护两套数仓架构，甚至需要不同的技术团队？

133

1

0

湖仓一体架构的落地带来了哪些主要收益？

217

1

0

在湖仓一体架构中，你们遇到了哪些稳定性和数据正确性的问题，并如何解决？

183

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

2026年阿里云服务器活动价格：轻量、经济型、通用算力型、计算型等热门实例活动价格参考

阿里云Qwen3.7 Max与Plus实测对比：纯文本旗舰与多模态全能王全维度解析

阿里云QoderWork完全指南：从入门到精通，打造全能AI工作搭档

2026口碑最好最适合中小企业的3款点单小程序制作工具

企业内容如何构建面向AI可见性的测量体系

相关解决方案

更多

云上高可用架构

Flink 与 Hologres 搭建实时数仓

高效实现前后端分离架构升级

低成本、高性能的湖仓一体化架构

极简运维，Serverless 高可用架构

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

flinkcdc在IDEA运行正常，打包就报错

Flink CDC 能适配达梦不？

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

有用flink cdc同步mysql到hive这样搞过的源码吗?

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC全量没问题，增量报错 file is not a valid field name

如何用实时数据同步打破企业数据孤岛？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

展开全部

还有其他疑问?