备案控制台

开发者社区问答正文

MaxCompute SQL优化与大数据开发时对于倾斜现象有几种解决方式呢？

MaxCompute SQL优化与大数据开发时对于倾斜现象有几种解决方式呢？

展开

收起

bnbajjyhyjfty 2021-12-11 16:55:30 914 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客5q6u2bzdfcir4

1:过滤数据过滤掉某些脏数据，比如说是否可以去掉null，去掉某些条件对应的值

2:加大并行度给任务添加处理资源，加大instance的数量，暴力

3:对数据进行拆分，分而治之如果大表join小表，我们可以用mapjoin，将小表cache进内存二次分发，加上随机前缀（数据膨胀），拆分数据集为热点+非热点再进一步处理大表join超大表，还可以考虑bloomfilter

4:组合使用上述方法，组合使用

5:修改业务实在没有进步空间，从业务上过滤数据

2021-12-11 16:56:03

赞同展开评论

问答分类：

SQL 分布式计算大数据 MaxCompute 云原生大数据计算服务 MaxCompute

问答标签：

SQL优化云原生大数据计算服务 MaxCompute大数据云原生大数据计算服务 MaxCompute开发云原生大数据计算服务 MaxCompute优化 sql云原生大数据计算服务 MaxCompute

问答地址：

开发者社区 > 大数据 > 问答

相关问答

大数据计算MaxCompute在SQL中使用这种笛卡尔join（不加on条件），应该怎么设置？

175

1

0

大数据计算MaxCompute执行的sql输出为什么是这个样子的呢？

106

1

0

在大数据计算MaxCompute中，odps java sdk 支持一次性执行多条sql吗？

196

1

0

在大数据计算MaxCompute中，在编写UDF（SQL自定义函数）时怎么实现某个参数是可填可不填？

143

1

0

大数据计算MaxCompute sql执行报错，怎么解决？

135

1

0

大数据计算MaxCompute的sql用窗口函数和group by计算标准差结果为什么不一致？

124

1

0

大数据计算MaxCompute有办法控制我每条sql 用多少cu吗？

96

1

0

大数据计算MaxCompute的datawork下面每个sql执行系统环境哪里可以配置？

140

1

0

大数据计算MaxCompute sql查询平台，数据地图，数据调度等均无法访问，为什么？

93

0

0

有没有python脚本可以根据大数据计算MaxCompute的运行实例拿到执行的sql啊？

144

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

MaxCompute SQL + AI：重塑企业智能决策的底层逻辑

有了 Chat，BI 会消失么？

C# 图书管理系统（三层架构）

2025年优测数据库压测工具：新功能上线的性能验证实践

用 Flink 做实时 ETL：别只盯着算子，真正的灵魂是「语义、状态和扛事能力」

还有其他疑问?