开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks如何配置putb导出数据?

DataWorks如何配置putb导出数据?

展开
收起
真的很搞笑 2023-10-29 18:09:49 64 0
3 条回答
写回答
取消 提交回答
  • 在DataWorks中配置PUTB(MaxCompute表数据传输至OSS)导出数据任务,您可以按照以下步骤进行操作:

    1. 首先,登录到阿里云DataWorks控制台。在DataWorks项目中选择需要配置导出任务的工作空间。

    2. 然后,在左侧导航栏中,单击“数据开发”,进入数据开发页面。

    3. 接着,单击“批量上传”,进入批量上传页面。

    4. 在批量上传页面中,选择“OSS”,然后单击“新建任务”。

    5. 在新建任务页面中,填写相关信息,如任务名称、OSS所在地域和OSS路径等。

    6. 完成以上步骤后,提交任务并等待执行完成即可。

    2023-10-30 21:49:19
    赞同 展开评论 打赏
  • 在DataWorks中配置PUTB(MaxCompute表数据传输至OSS)导出数据任务,您可以按照以下步骤进行操作:

    1. 登录到阿里云DataWorks控制台:https://workbench.data.aliyun.com/console。

    2. 在DataWorks项目中选择需要配置导出任务的工作空间。

    3. 点击“新建任务”,选择“MaxCompute”类型,然后选择“导出数据”。

    4. 在“导出数据”页面,填写或选择以下信息:

      • 输出路径:选择OSS的路径,例如"/path/to/your/data"。
      • 输出格式:可以选择CSV、JSON、AVRO等格式。
      • 输出选项:可以设置分片大小、压缩方式等选项。
    5. 在“任务属性”页面,填写或选择以下信息:

      • 数据库:选择MaxCompute的数据库。
      • 表:选择需要导出的MaxCompute表。
      • 分区列:选择需要导出的分区列。
    6. 保存任务后,可以在“我的任务”页面看到刚创建的导出任务。点击任务,可以查看任务详情,包括任务状态、执行历史等信息。

    2023-10-30 15:00:48
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在DataWorks中,可以使用PUTB(Put Big)功能将数据导出到外部存储系统中。以下是如何配置PUTB导出数据的步骤:

    1. 登录DataWorks控制台,选择要导出数据的工作区。
    2. 打开需要导出数据的MaxCompute表。
    3. 在右侧的操作栏中,选择“导出数据”按钮。
    4. 在弹出的导出数据对话框中,填写导出数据的相关参数:

      • 导出路径:指定导出数据的目标存储位置,可以是OSS、HDFS、本地磁盘等。
      • 文件命名规则:自定义导出数据的文件名。
      • 导出方式:可以选择全量导出或增量导出。
      • 其他参数:根据需要选择是否保留原始分区信息、是否压缩等。
    5. 点击“提交”按钮,开始导出数据。

    2023-10-30 13:15:55
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks全链路数据质量解决方案-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多