备案控制台

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

我们这边有个需求，我希望把我们的mongo数据库中的有400g多个g的数据（每年增加几十个g) 同步

我们这边有个需求，我希望把我们的mongo数据库中的有400g多个g的数据（每年增加几十个g) 同步进数仓，然后，然后不定期（高频的时候会每周一次）有大概要取出至少100多个g（最大可能为200个g)的数据，有时候还不是一张表全量导出，而是做一些定制化的查询，再导出，请问这种方案可行嘛，如果可行，费用大部分在哪个环节？或者有没有其他的方案？

展开

收起

十一0204 2023-03-29 10:09:27 223 0

1 条回答

写回答

取消提交回答

意中人jswy

意中人就是我呀！

方案可行，如果是不定期同步，可以用DataWorks+MaxCompute作为解决方案。使用DataWorks数据集成离线同步MongoDB数据源中的数据，全量就不需要写检索查询条件，只有增量需要写检索查询条件，同步完成后可以创建一个odps SQL节点作为下游，执行定制化SQL查询，导出跟导入一样，使用DataWorks数据集成，导入是MongoDB Reader插件，导出是MongoDB Writer插件。主要费用在DataWorks和MaxCompute的费用，如果只是做数据同步和查询，会有DataWorks数据集成资源组+调度资源组+MaxCompute存储+MaxCompute计算费用。相关文档： MongoDB Reader插件：https://help.aliyun.com/document_detail/605053.html MongoDB Writer插件：https://help.aliyun.com/document_detail/605721.html DataWorks费用：https://help.aliyun.com/document_detail/118545.html MaxCompute费用：https://help.aliyun.com/document_detail/53056.htm（此回答整理自钉钉群“MaxCompute开发者社区2群”）

2023-03-29 10:10:51

赞同展开评论打赏

问答分类：

数据库云原生大数据计算服务 MaxCompute 云原生数据仓库AnalyticDB MySQL版

问答标签：

数据库同步数据库数据 mongo数据库数据库mongo 数据库400g

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

Mongo Shell登录MongoDB数据库提示“Authentication failed”错误

208

1

0

mongo 登录数据库需要最少的权限有哪些？

18

0

0

通过Mongo Shell登录MongoDB数据库提示“Connection reset by...

67

1

0

Linux实例使用Mongo Shell登录MongoDB数据库提示“connection ...

21

0

0

DMS上如何配置mongo数据库迁移

41

1

0

在DBS数据库备份如果我自建数据库大小为300G，我买400G额度的small规格够吗？

42

1

0

flink cdc 连接mongo数据库。想用datastream读取整库方式。现在报错什么原因？

98

1

0

shake数据库mongo-shake 现在是否支持，mongo间只同步一个表的部分字段？

156

1

0

有遇到过Mongo Shake数据库同步collection数量对不齐，document数量也对不齐

223

0

0

OceanBase数据库这是部署失败还是启动报错了，有地方可以看到错误日志么？

45

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

热门讨论

热门文章

大数据计算MaxCompute配置参数在开发环境进行调度，参数解析不出来，这是需要额外做什么配置吗？

MaxCompute中执行SQL报错ODPS-0130071

Maxcompute中如何处理ODPS-0130071:Semantic analysis exce

数据采集中数据源共包含哪些？

MaxCompute分区表需要开启全表扫面吧？或者单独查询某一个分区。怎么开启全表扫描呀？

DataWorks失败：ODPS-0130071:[0,0]语义分析异常-物理计划生成失败？

DataWorks中DBeaver查询MaxCompute，默认是UTC时区，这个要怎么修改呢？

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

大数据计算MaxCompute在某个工作空间下怎么查询所有的表名？

遇到Maxcompute中出现下面问题怎么办

展开全部

阿里云开源离线同步工具DataX3.0介绍

每个人都应该知道的25个大数据术语

盘古：阿里云飞天分布式存储系统设计深度解析

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

空格App亿元A轮融资背后：云上多场景技术架构实践与经验

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

【转载】时隔一年多，我又用起了 Superset

MaxCompute常见错误汇总（更新ing）

展开全部

相关课程

更多

数据库的前世今生

3068

2

去学习

数据库核心概念

1737

7

去学习

从传统数据库到云数据库演进

638

1

去学习

数据库常见问题排查

436

2

去学习

数据库及SQL/MySQL基础

6951

22

去学习

高校精品课-西安交通大学 -数据库理论与技术

497

9

去学习

相关电子书

更多

DTCC 2022大会集锦《云原生一站式数据库技术与实践》 立即下载

阿里云瑶池数据库精要2022版 立即下载

2022 DTCC-阿里云一站式数据库上云最佳实践 立即下载

相关实验场景

更多