文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

请问spark引擎是可以直接访问大数据计算MaxCompute表的么？

请问spark引擎是可以直接访问大数据计算MaxCompute表的么？我尝试了spark2.3也不行

展开

收起

真的很搞笑 2023-11-12 07:51:49 277 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

芯在这

可以访问，
本地local模式：https://help.aliyun.com/zh/maxcompute/user-guide/running-modes?spm=a2c4g.11186623.0.0.6396f54eubRv1b#section-1tq-j9h-c6m

或者打成jar包放到DataWorks的spark节点上：https://help.aliyun.com/zh/maxcompute/user-guide/running-modes?spm=a2c4g.11186623.0.0.6396f54eubRv1b#section-uqe-uwt-q0b，此回答整理自钉群“MaxCompute开发者社区2群”

2023-11-12 14:41:21

赞同展开评论
sunrr

确实，Spark引擎可以访问大数据计算MaxCompute表。为了实现这一操作，需要借助于Spark Connector这个工具，通过调用Storage API来访问MaxCompute。具体来说，您可以使用OdpsOps对象的readTable方法将MaxCompute中的表数据加载到Spark中。

此外，MaxCompute Spark也是MaxCompute提供的兼容开源的Spark计算服务，它在统一的计算资源和数据集权限体系之上，提供Spark计算框架，支持用户以熟悉的开发使用方式提交运行Spark作业，以满足更丰富的数据处理分析场景。

但需要注意的是，目前Spark Connector只能使用独享Tunnel并发资源组，不能使用共享资源组，并且不支持读写JSON数据类型的数据。同时，在使用Spark引擎访问MaxCompute表时，需要先确保已开通MaxCompute服务并创建了MaxCompute项目。

2023-11-12 09:36:11

赞同展开评论

问答分类：

分布式计算 MaxCompute Spark 大数据云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute MaxCompute 大数据计算云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute spark spark云原生大数据计算服务 MaxCompute apache spark大数据

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

Dataworks 里的 ODPS spark 节点访问不到 maxcompute 里的表

224

1

0

大数据计算MaxCompute on spark 可以在硅谷节点使用吗？

177

1

0

云数据仓库ADB Spark SQL访问MaxCompute数据源-支持的库表操作

257

1

0

大数据计算MaxCompute 想申请加到spark公网访问白名单，可以从哪边申请？

223

1

0

为什么选择Spark作为大数据处理引擎？

164

1

0

大数据计算MaxCompute的odps-spark-datasource版本在哪查看？

198

1

0

大数据计算MaxCompute如何进行 spark 3.X 快速开发呢？是要用模版开发么？

188

1

0

云数据仓库ADB Spark SQL访问OSS外表-（可选）步骤五：删除外表

211

1

0

在DMS中是否有单独执行Spark SQL预览查询结果的功能，而不是执行整个任务并写入表？

269

1

0

大数据计算MaxCompute的spark on mc，要在dw上配置的话，里面的参数都有哪些呢？

158

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

从问题库到AI回答样本：数据清洗与指标聚合流程

阿里云人工智能平台PAI对接完全指南：从入门到生产级部署

从原始AI回答到可分析指标：数据清洗与口径统一流程

如何用数字化工具沉淀运营数据？2026让管理决策告别“经验驱动”

仓储管理数字化升级解析：从条码扫描到RFID智能识别的技术演进

相关解决方案

更多

基于 Spark 和 PyTorch 的模型训练方案

轻松打造一站式图像智能检索引擎

快速实现办公环境安全访问云资源

通过私网安全高效访问 AI 模型服务

部署SSL证书，实现Web服务加密访问

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

请问下大数据计算MaxCompute dataworks是否有全局变量？

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

咨询一下，我配置了MySQL实时同步到MaxCompute的任务，但MySQL数据更新后，MaxCo

大数据计算MaxCompute作业运维排序报错，如何解决？

在大数据计算MaxCompute中，这种多久能查询到？

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

优酷背后的大数据秘密

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

展开全部

还有其他疑问?