在DataWorks中,准备数据源需要经过几个步骤。首先,您需要登录DataWorks控制台并进入工作空间管理中心页面。在管理中心页面中,您可以找到并点击左侧导航栏的数据源选项,进入数据源管理页面。
在数据源管理页面,您可以进行数据源的创建与管理。例如,配置数据集成同步任务时,通过选择数据源名称来确定同步任务读取与写入的数据库。
添加数据源之前,请确保已完成以下准备工作:已购买开通来源数据源和去向数据源,已在数据源数据库中创建好可对接访问的账号。
对于MySQL数据源,您需要通过RDS创建MySQL实例,并获取该实例ID。同时,需要在RDS控制台添加白名单,如果是通过自定义资源组调度RDS的数据同步任务,则必须把自定义资源组的机器IP也加入RDS的白名单中。
最后,可以在设置数据源页面中,选择数据源类型为DataWorks数据服务,并在选择已有数据源列表中,选择您已经添加的DataWorks数据服务数据源。在选择API列表中选择生成的DataWorks数据服务API,然后单击预览数据源返回结果,查看数据返回结果。
在DataWorks中准备数据源,首先需要登录DataWorks控制台,单击左侧导航栏的管理中心,在下拉框中选择对应工作空间后单击进入管理中心。进入工作空间管理中心页面后,单击左侧导航栏的数据源,进入数据源页面。
添加数据源前,您需要完成以下准备工作:
DataWorks支持在数据源管理页面创建与管理数据源,例如在配置数据集成同步任务时,通过选择数据源名称来确定同步任务读取与写入的数据库。在进行数据同步任务开发时,您需要在DataWorks上创建一个对应的数据源。如果是通过自定义资源组调度RDS的数据同步任务,必须把自定义资源组的机器IP也加入RDS的白名单中。
准备数据源主要分为以下几个步骤:
通过RDS创建MySQL实例,获取RDS实例ID。详情请参见创建RDS MySQL实例。在RDS控制台添加白名单,详情请参见添加白名单。说明 如果是通过自定义资源组调度RDS的数据同步任务,必须把自定义资源组的机器IP也加入RDS的白名单中。下载本教程使用的原始数据indicators_data、steal_flag_data和trend_data。上传原始数据至RDS数据源,详情请参见将Excel的数据导入数据库。
https://help.aliyun.com/document_detail/146695.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。