文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

有没有批量进行离线采集的文档呀？

有没有批量进行离线采集的文档呀？

展开

收起

solitude. 2023-02-21 17:46:47 514 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

3 条回答

写回答

取消提交回答

认真学习的heart

按照我的步骤尝试一下：

在阿里云DataWorks控制台中选择“工作空间”并进入相应工作空间，选择“数据集成”菜单。

在“数据集成”页面中，选择“离线同步任务”选项卡，然后单击“创建任务”按钮。

在“创建离线同步任务”页面中，填写任务名称和任务描述，然后选择需要同步的源数据源和目标数据源。如果源数据源为数据库类型，则需要填写数据库信息，包括连接信息、数据库名、用户名和密码。

在“数据源配置”页面中，为每个源数据表选择同步方式（全量或增量），并配置同步规则。如果需要同步多张数据表，则可以单击“添加数据表”按钮添加更多的数据表。

在“同步设置”页面中，配置同步任务的调度时间和同步延迟时间。

在“高级设置”页面中，可以配置数据过滤和转换规则、数据同步的性能和并发度等。

单击“确认”按钮，创建离线同步任务。

在“离线同步任务”列表中，选择需要执行的任务，单击“手动执行”按钮，手动执行数据同步任务。可以选择“全量同步”或“增量同步”方式执行任务。 https://help.aliyun.com/document_detail/449451.html

2023-02-22 23:02:56

赞同展开评论
一个臻吖

可以看下DataWorks的同步解决方案。参考该链接https://help.aliyun.com/document_detail/449451.html。此回答整理自钉钉群”MaxCompute开发者社区2群“

2023-02-21 17:58:36

赞同展开评论
柒号华仔

Tunnel是MaxCompute提供的离线批量数据通道服务，主要提供大批量离线数据上传和下载，仅提供每次批量大于等于64MB数据的场景，小批量流式数据场景请使用DataHub实时数据通道以获得更好的性能和体验。

2023-02-21 17:56:03

赞同展开评论

问答分类：

云原生大数据计算服务 MaxCompute

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

92889

50

0

this xml file does not appear to have any style in

61435

11

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

142247

16

0

C语言数组赋值报错，打印出来的是乱码，怎么解决？

1623

1

0

#支付宝授权提示请在支付宝客户端打开链接

24970

19

0

阿里云怎样设置二级域名以及域名解析？

66943

14

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

284812

11

0

基础语言百问-Python

69749

30

0

C语言中default使用注意事项是什么？

1655

1

0

搭建dnf私服需要大概啥配置的

10472

2

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

阿里巴巴大数据计算

347743

+ 订阅

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析，将数据高效转换为业务洞察。

相关文章

MaxCompute SQL AI 实操：业务员外呼备注有效性判断

寻找 AI 全能王——阿里云 Data+AI 工程师全球大奖赛正式开启

金融行情系统中，API 接入常见的 5 个工程问题

#Nginx教程 Nginx作为目前最流行的高性能Web服务器和反向代理服务器，凭借其高并发、低内存消耗的特点，被广泛应用于各类生产环境。本文将从零开始，带你快速掌握Nginx的核心配置与实战技巧。

Spark SQL 函数分类导航

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

请问下大数据计算MaxCompute dataworks是否有全局变量？

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

咨询一下，我配置了MySQL实时同步到MaxCompute的任务，但MySQL数据更新后，MaxCo

大数据计算MaxCompute作业运维排序报错，如何解决？

在大数据计算MaxCompute中，这种多久能查询到？

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

优酷背后的大数据秘密

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

【转载】时隔一年多，我又用起了 Superset

展开全部

还有其他疑问?