如何配置从dataworks数据库同步抽取数据?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
配置一个从Oracle数据库同步抽取数据的作业。{"type":"job","version":"2.0",//版本号。"steps":[{"stepType":"oracle","parameter":{"fetchSize":1024,//该配置项定义了插件和数据库服务器端每次批量数据获取条数。"datasource":"",//填写添加的数据源名。"column":[//列名。"id","name"],"where":"",//筛选条件。"splitPk":"",//切分键。"table":""//表名。},"name":"Reader","category":"reader"},{"stepType":"stream","parameter":{},"name":"Writer","category":"writer"}],"setting":{"errorLimit":{"record":"0"//错误记录数。},"speed":{"throttle":true,//当throttle值为flase时,mbps参数不生效,表示不限流;当throttle值为true时,表示限流。"concurrent":1 //作业并发数。"mbps":"12"//限流}},"order":{"hops":[{"from":"Reader","to":"Writer"}]}} "to":"Writer"}]}} https://help.aliyun.com/document_detail/137727.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。