备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks创建EMR Hive节点操作步骤？

DataWorks创建EMR Hive节点操作步骤？

展开

收起

wenti 2023-01-15 21:13:15 415 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

665661

进入数据开发页面。登录DataWorks控制台。在左侧导航栏，单击工作空间列表。选择工作空间所在地域后，单击相应工作空间后的进入数据开发。鼠标悬停至图标，单击EMR > EMR Hive。您也可以找到相应的业务流程，右键单击EMR，选择新建 > EMR Hive。在新建节点对话框中，输入节点名称，并选择目标文件夹。说明节点名称必须是大小写字母、中文、数字、下划线（_）和小数点（.），且不能超过128个字符。单击提交。在节点编辑页面，输入代码。-- SQL语句示例。-- SQL语句最大不能超过130KB。show tables;-- 可以结合调度参数使用。select 'unknown';-- 系统会自动为SELECT语句加上'limit 10000'的限制。select * from userinfo ;调度参数使用详情可参考文档：基础属性：调度参数如果您需要修改代码中的参数赋值，请单击界面上方工具栏的高级运行。参数赋值逻辑详情请参见：运行，高级运行和开发环境冒烟测试赋值逻辑有什么区别相关文档：Hive SQL作业配置说明如果您的工作空间绑定多个EMR引擎，需要选择EMR引擎。如果仅绑定一个EMR引擎，则无需选择。编辑高级配置。"USE_GATEWAY":true ，表示任务会被提交到EMR gateway上执行，默认提交到header节点。"SPARK_CONF": "--conf spark.driver.memory=2g --conf xxx=xxx" ，设置spark 任务运行参数，多个参数在该key中追加。“queue”：提交作业的调度队列，默认为default队列。“vcores”：虚拟核数，默认为1。“memory”：内存，默认为2048MB（用于设置启动器Launcher的内存配额）。“priority”：优先级，默认为1。“FLOW_SKIP_SQL_ANALYZE”：SQL语句执行方式，参数值为false表示每次执行——该回答整理自钉群“DataWorks交流群(答疑@机器人)“

2023-01-15 21:49:02

赞同展开评论
co63oc_

GitHub https://github.com/co63oc/cloud

https://help.aliyun.com/document_detail/137518.html 创建EMR Hive节点

2023-01-15 21:19:01

赞同展开评论

问答分类：

SQL DataWorks HIVE 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks节点 dataworks emr 大数据开发治理平台 DataWorks emr emr节点 dataworks Hive

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

阿里云云效

dataworks中的sql是基于hive sql吗？

254

3

0

DataWorks把emr数据源删了再重新创建发现就这样了，后面这个项目空间没删就可以选？

124

1

0

有个dataworks空间已经重新绑定了一个EMR数据源，但是任务一直示：该文件对应引擎实例已失效？

152

1

0

Dataworks on EMR服务中，EMR集群的日常管理和维护工作主要由阿里云负责吗？

95

0

0

dataworks为啥只能读 maxcomputer 不能读 emr 呢？

156

1

0

dataworks能不能把某个数据集从 emr 跑出来以后导入 pai 里面使用？

71

1

0

云原生大数据计算服务 MaxCompute数据上云方面，DataWorks数据集成是怎样的？

1262

1

0

使用三个odps sql节点，同时向同一张表的同一个分区写入数据，有时报错，有时不会报错，是什么原因

3605

1

0

Dataworks的数据地图可以查看CDH集群 hive的表以及血缘信息嘛

1962

1

0

根据数据治理的需求五大层次，DataWorks有哪些对应的产品模块？

1156

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

DataWorks

2707

+ 订阅

相关文章

蓝易云：MySQL的Redo Log与Binlog机制对照分析

蓝易云：解决MySQL "ONLY_FULL_GROUP_BY" 错误的方案

蓝易云：结合Spring和MyBatis实现DAO层操作综述

Oracle 视图

MaxCompute SQL + AI：重塑企业智能决策的底层逻辑

热门讨论

热门文章

DATAX连接5.7版本mysql数据库报错，连接8.0没问题，URL没有问题

阿里云磁盘大小是多少？

在智能数据建模中涉及的FML是什么的缩写，什么意思？

数据来源：com.alibaba.fastjson.JSONException: syntax er

咱们这个API Path什么意思呢，是自定义的接口吗？还是统一规范的？

Dataphin和 Dataworks 有啥区别呢？

DataWorks表管理创建表报precision and scale is not current

DataWorks中假如odps 有个string字段需要容纳的内容长度超过8M了，我想接进来？

数据服务报429请求次数过多咋办呀

DataWorks创建表提交到开发、生产环境时报错：列名包含关键字，请修改列名 date，如何解决？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

DataWorks百问百答69：有哪些数据集成报错（数据集成报错归类）？

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

语雀+通义千问+DataWorks，让AI定期推送每周总结

基于DataWorks搭建新零售数据中台

DataWorks数据安全能力模块介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

DataWorks产品使用合集之怎么选择Doris或StarRocks作为DataWorks的OLAP解决方案

展开全部

还有其他疑问?