备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks同步业务场景配置化功能有哪些？

DataWorks同步业务场景配置化功能有哪些？

展开

收起

wenti 2023-01-09 13:02:39 258 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

665661

实际业务场景下，数据同步通常不能通过一个或多个简单离线同步或者实时同步任务完成，而是由多个离线同步、实时同步和数据处理等任务组合完成，这就会导致数据同步场景下的配置复杂度非常高。为了解决上述问题，DataWorks提出了面向业务场景的同步任务配置化方案，支持不同数据源的一键同步功能，例如“一键实时同步至Elasticsearch”、“一键实时同步至Hologres”和“一键实时同步至MaxCompute”功能等，通过此类功能，您只需要进行简单的配置，就可以完成一个复杂业务场景。以业务数据库数据同步到MaxCompute数据仓库为例，当有大量的数据存储在数据库系统里，需要将数据库中的全量及增量数据同步到MaxCompute进行数仓分析时，数据集成传统方式是通过全量同步或者依赖数据库表中的modify_time等字段进行增量同步。但实际生产场景下，数据库表中不一定存在modify_time等字段，因此不能使用传统的基于JDBC抽取的方式进行增量同步。而“一键实时同步至MaxCompute”功能实现了数据库全增量实时同步到MaxCompute以及在MaxCompute上进行自动的全增量合并，可以使整个同步场景化繁为简。同步任务配置化方案具有如下优势：全量数据初始化。增量数据实时写入。增量数据和全量数据定时自动合并写入新的全量表分区。——该回答整理自钉群“DataWorks交流群(答疑@机器人)“

2023-01-09 14:30:08

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

为了解决上述问题，DataWorks提出了面向业务场景的同步任务配置化方案，支持不同数据源的一键同步功能，例如，“一键实时同步至Elasticsearch”、“一键实时同步至Hologres”和“一键实时同步至MaxCompute”功能等，通过此类功能，您只需要进行简单的配置，就可以完成一个复杂业务场景。

2023-01-09 13:58:54

赞同展开评论

问答分类：

DataWorks 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks同步大数据开发治理平台 DataWorks场景大数据开发治理平台 DataWorks功能大数据开发治理平台 DataWorks同步配置大数据开发治理平台 DataWorks配置

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks天任务依赖场景示例（依赖当天小时/依赖昨天小时/依赖天/依赖分钟）

111

1

0

请教下DataWorks，我现在有个场景，一个 polar db 有上万个数据库，有什么好的方案吗？

157

1

0

DataWorks现在有个场景，如何通过高级sql实现遍历所有table_[year]进行数据查询？

123

1

0

DataWorks中pyodps支持使用类似Matplotlib的画图包吗，节点里能使用画图功能么？

148

1

0

DataWorks批量终止和重跑这两项功能有api接口吗，没找到？

120

1

0

dataworks中特殊场景是 mysql reader有文档或者参考吗？

123

1

0

dataworks自定义功能开发接口需要收费吗？

100

0

0

大数据计算MaxCompute的dataworks同步数据功能用的是maxcompute的资源还是？

96

1

0

DataWorks有10亿数据，如果定时任务的话只能在这做了或者针对我这种场景有没啥其他做法建议？

199

14

0

DataWorks用逆向建模功能时，会直接报错，这个有什么办法解决吗？

121

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

DataWorks

2707

+ 订阅

相关文章

【赵渝强老师】阿里云大数据集成开发平台DataWorks

阿里云大数据AI产品月刊-2025年8月

智能体创业新风口：从算法开发到IP运营的范式转移——AI智能体如何重塑创新创业的底层逻辑

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

Forrester Wave™: AI Platforms in China, Q4 2025发布，阿里云入选领导者

热门讨论

热门文章

DATAX连接5.7版本mysql数据库报错，连接8.0没问题，URL没有问题

DataWorks创建表提交到开发、生产环境时报错：列名包含关键字，请修改列名 date，如何解决？

数据来源：com.alibaba.fastjson.JSONException: syntax er

Dataphin和 Dataworks 有啥区别呢？

在智能数据建模中涉及的FML是什么的缩写，什么意思？

阿里云磁盘大小是多少？

兄弟们啊，同步中DI、RI到底什么意思，是什么的缩写？

咱们这个API Path什么意思呢，是自定义的接口吗？还是统一规范的？

数据服务报429请求次数过多咋办呀

DataWorks什么是补数据？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

欢迎加入飞天大数据平台交流群

DataWorks售前咨询

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

语雀+通义千问+DataWorks，让AI定期推送每周总结

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

数据管理能力成熟度模型

基于DataWorks搭建新零售数据中台

DataWorks产品使用合集之怎么选择Doris或StarRocks作为DataWorks的OLAP解决方案

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

展开全部

还有其他疑问?