备案控制台

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

在大数据计算MaxCompute中，有其他优化空间吗？

在大数据计算MaxCompute中，https://logview.aliyun.com/logview/?h=http://service.cn-s...LCJWZXJzaW9uIjoiMSJ9 这个任务执行很慢，大表关联小表，获取前13个月的数据，大表有5000万表，小表268万，已经加mapjoin了

内存也加了，需要快10分钟，才计算出来，有其他优化空间吗？

展开

收起

LLLA 2024-01-23 22:43:18 48 0

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在大数据计算MaxCompute中，如果任务执行很慢，可以考虑以下优化方法：
1. 增加分区数：根据数据量和查询需求，适当增加大表和小表的分区数，以提高查询性能。
2. 使用索引：为大表的关键字段创建索引，以加速查询速度。
3. 调整mapjoin参数：根据实际需求，调整mapjoin的参数，如内存分配、并行度等，以提高查询性能。
4. 优化SQL语句：检查SQL语句是否存在性能瓶颈，如子查询、连接操作等，尝试优化这些部分。
5. 分批处理：将大表关联小表的操作分批进行，每次处理一部分数据，避免一次性处理大量数据导致内存不足或查询超时。
6. 考虑使用其他大数据工具：如果以上方法仍无法满足性能需求，可以考虑使用其他大数据工具，如Hive、Impala等，它们可能提供更好的性能优化支持。
2024-01-24 13:34:36

赞同展开评论打赏
AAAOY

可以把这个参数odps.sql.mapper.split.size 调小一些，让map阶段的并发大一些
https://help.aliyun.com/zh/maxcompute/use-cases/optimize-sql-statements?spm=a2c4g.11186623.0.i12 此回答来自钉群“MaxCompute开发者社区1群”

2024-01-23 22:55:17

赞同展开评论打赏

问答分类：

分布式计算 MaxCompute 大数据云原生大数据计算服务 MaxCompute

问答标签：

大数据计算云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute优化云原生大数据计算服务 MaxCompute MaxCompute 数据计算云原生大数据计算服务 MaxCompute空间云原生大数据计算服务 MaxCompute空间

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关产品：

云原生大数据计算服务 MaxCompute

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

在大数据计算MaxCompute中，想了解一个项目空间，每天新增的数据量的大小，有简单的方法吗？

37

2

0

DataWorks odps 中的表删除一些分区之后，占用空间没有减少，这个是延迟释放空间吗？

71

1

0

如何设置ODPS客户端的默认项目空间？

64

1

0

大数据计算MaxCompute任务长时间卡在这个阶段，如何优化？

72

1

0

RDMA技术的主要优势是什么？它如何帮助大数据分布式计算优化？

128

1

0

大数据计算MaxCompute中，已经是空间管理员了，为啥还没有权限去执行命令啊？

41

0

0

在大数据计算MaxCompute不是显示的MaxCompute的空间名称，怎么回事？

35

1

0

MaxCompute工具及下载：MaxCompute Studio：开发 SQL 程序：提交 SQL 脚本

2312

0

0

MaxCompute工具及下载：MaxCompute Studio：开发 SQL 程序：编写 SQL 脚本

1976

0

0

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

981

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关产品

云原生大数据计算服务 MaxCompute

文档详情产品详情

热门讨论

热门文章

MaxCompute中执行SQL报错ODPS-0130071

遇到Maxcompute中出现下面问题怎么办

Maxcompute中如何处理ODPS-0130071:Semantic analysis exce

大数据计算MaxComputesr, adb指的啥？

MaxCompute sql任务报错ODPS-0130161

百问求答（5）MaxCompute专场！回答问题赢SKG颈椎按摩仪等好礼

Maxcompute中如何处理expect equality expression (i.e., o

DataWorks失败：ODPS-0130071:[0,0]语义分析异常-物理计划生成失败？

大数据计算MaxCompute pyodps怎么增加运行的并行度？

sparksql中cte物化方式是怎样的

展开全部

2017杭州云栖大会FAQ（持续更新中）

MaxCompute/DataWorks 数据集成与开发实践

唱吧基于 MaxCompute 的大数据之路

美甲帮：玩转指甲上的大数据平台

大数据开发套件中数据同步-日志报错回滚信息的一些问题总结

用Java代码调用MaxCompute

大数据开发套件—数据集成常见问题

MaxCompute预付费资源监控工具-CU管家

MaxCompute+ Geabase 大话健康知识图谱取经之路

人工智能居然会模仿人类品酒

展开全部

相关课程

更多

大数据Spark2020最新课程（知识精讲与实战演练）第二阶段

236

77

去学习

大数据Spark2020版（知识精讲与实战演练）第三阶段

138

72

去学习

大数据Spark2020版（知识精讲与实战演练）第四阶段

174

20

去学习

2020版大数据实战项目之DMP广告系统（第三阶段）

140

9

去学习

2020版大数据实战项目之DMP广告系统（第四阶段）

67

18

去学习

2020版大数据实战项目之DMP广告系统（第七阶段）

104

17

去学习

相关电子书

更多

Data+AI时代大数据平台应该如何建设 立即下载

大数据AI一体化的解读 立即下载

极氪大数据 Serverless 应用实践 立即下载

相关实验场景

更多