开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks如何准备数据准备数据源?

DataWorks如何准备数据准备数据源?

展开
收起
真的很搞笑 2023-10-29 17:48:43 49 0
4 条回答
写回答
取消 提交回答
  • 在DataWorks中,准备数据源需要经过几个步骤。首先,您需要登录DataWorks控制台并进入工作空间管理中心页面。在管理中心页面中,您可以找到并点击左侧导航栏的数据源选项,进入数据源管理页面。

    在数据源管理页面,您可以进行数据源的创建与管理。例如,配置数据集成同步任务时,通过选择数据源名称来确定同步任务读取与写入的数据库。

    添加数据源之前,请确保已完成以下准备工作:已购买开通来源数据源和去向数据源,已在数据源数据库中创建好可对接访问的账号。

    对于MySQL数据源,您需要通过RDS创建MySQL实例,并获取该实例ID。同时,需要在RDS控制台添加白名单,如果是通过自定义资源组调度RDS的数据同步任务,则必须把自定义资源组的机器IP也加入RDS的白名单中。

    最后,可以在设置数据源页面中,选择数据源类型为DataWorks数据服务,并在选择已有数据源列表中,选择您已经添加的DataWorks数据服务数据源。在选择API列表中选择生成的DataWorks数据服务API,然后单击预览数据源返回结果,查看数据返回结果。

    2023-10-30 21:46:48
    赞同 展开评论 打赏
  • 在DataWorks中准备数据源,首先需要登录DataWorks控制台,单击左侧导航栏的管理中心,在下拉框中选择对应工作空间后单击进入管理中心。进入工作空间管理中心页面后,单击左侧导航栏的数据源,进入数据源页面。

    添加数据源前,您需要完成以下准备工作:

    1. 数据源开通:确保已购买开通来源数据源和去向数据源。
    2. 对接账号创建与授权:已在数据源数据库中创建好可对接访问的账号。

    DataWorks支持在数据源管理页面创建与管理数据源,例如在配置数据集成同步任务时,通过选择数据源名称来确定同步任务读取与写入的数据库。在进行数据同步任务开发时,您需要在DataWorks上创建一个对应的数据源。如果是通过自定义资源组调度RDS的数据同步任务,必须把自定义资源组的机器IP也加入RDS的白名单中。

    2023-10-30 15:34:17
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    准备数据源主要分为以下几个步骤:

    1. 准备原始数据源:例如MySQL、ODPS等。
    2. 注册数据源:在DataWorks中注册您的数据源。
    3. 检查连接信息:确认数据源中的连接信息,包括URL、用户名、密码等。
    4. 检查数据表:检查表中的字段、类型等信息。
    5. 创建新表:根据需求创建新的表,并验证新表。
    2023-10-30 14:44:32
    赞同 展开评论 打赏
  • 通过RDS创建MySQL实例,获取RDS实例ID。详情请参见创建RDS MySQL实例。在RDS控制台添加白名单,详情请参见添加白名单。说明 如果是通过自定义资源组调度RDS的数据同步任务,必须把自定义资源组的机器IP也加入RDS的白名单中。下载本教程使用的原始数据indicators_data、steal_flag_data和trend_data。上传原始数据至RDS数据源,详情请参见将Excel的数据导入数据库。
    https://help.aliyun.com/document_detail/146695.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-10-29 22:50:11
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多