文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

大数据计算MaxCompute这是发生数据倾斜了吗？

大数据计算MaxCompute这是发生数据倾斜了吗？我的sql如下set odps.sql.unstructured.oss.commit.mode =true;
set odps.sql.mapper.split.size=256;
set odps.sql.metering.value.max=1500;
set odps.stage.mapper.mem = 2048;
set odps.stage.mapper.jvm.mem = 4096;
insert OVERWRITE TABLE dwd_oss_risk3_service_et_di PARTITION(pt,country,app_type)
select * from dwd_risk3_service_et_di
where app_type !='third'
and pt<'2024-03-01'
and pt>='2024-02-01'
这是报错信息

展开

收起

真的很搞笑 2024-03-21 07:45:18 246 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

历年考试不作弊

根据您提供的SQL语句和报错信息，无法确定是否发生了数据倾斜。数据倾斜是指数据在分布式计算过程中不均匀地分布在各个节点上，导致某些节点处理的数据量过大而其他节点处理的数据量过小，从而影响整体的计算效率。

要判断是否发生了数据倾斜，需要查看具体的报错信息以及集群的资源使用情况。通常，数据倾斜会导致某些节点的CPU、内存或磁盘I/O等资源被大量占用，从而导致作业运行时间延长或失败。

建议您检查MaxCompute的日志和监控信息，以获取更多关于数据倾斜的详细信息。此外，您还可以尝试调整SQL语句中的分区键、过滤条件或优化查询逻辑，以减少数据倾斜的可能性。

2024-03-31 21:35:07

赞同展开评论
芯在这

oom了。调整一下这几个flag
set odps.stage.mapper.mem=8192; // 默认2048
set odps.stage.reducer.mem=8192; // 默认2048
set odps.stage.joiner.mem=8192; // 默认2048
少用udf或者不用，这几个值最大可以设置到12288
如果还不行，就只能单独导入了。你的数据量太大了。还不行就试试加点reduce.num 的数量，set odps.stage.reducer.num =xxx; ，此回答整理自钉群“MaxCompute开发者社区2群”

2024-03-21 08:45:12

赞同展开评论

问答分类：

分布式计算 MaxCompute 大数据 SQL 云原生大数据计算服务 MaxCompute 对象存储

问答标签：

云原生大数据计算服务 MaxCompute MaxCompute 大数据计算云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute数据倾斜云原生大数据计算服务 MaxCompute大数据计算

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

请问大数据计算MaxCompute有没有官方的调优文档可以看下呢?

317

3

0

大数据计算MaxCompute schema复制多了还不行这是什么限制?

227

2

0

大数据计算MaxCompute 如果想实现A[:N]这种指定元素个数的取法可以咋写?

342

2

0

请问下大数据计算MaxCompute离线同步节点会自动移除字段的前后空格吗？

248

2

0

大数据计算MaxCompute存储每小时都有一个几十G的量是按存储收费还是？

224

3

0

大数据计算MaxCompute查询max-compute的表数据报这个错是怎么回事啊？

273

2

0

大数据计算MaxCompute我这边想更改字段长度报错了？

833

3

0

在大数据计算MaxCompute中，dataworks 、maxcompute有无最新的视频教程？

189

1

0

什么是大数据SQL数据倾斜？

193

1

0

在大数据计算MaxCompute中，用哪个函数转换比较好呢？

359

4

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

阿里云服务器ECS实例规则怎么选？选型指南与最佳实践参考

Agentic AI 的预算，不能只花在模型上

阿里云数据管理DMS对接使用全流程：从零搭建企业级数据管控平台

阿里云Quick BI智能商业分析对接配置完全指南：从数据源接入到嵌入式集成

AI+本地生活时代，2026年同城外卖系统源码开发有哪些新变化？

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

高效存储和处理多媒体数据

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

请问下大数据计算MaxCompute dataworks是否有全局变量？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

大数据计算MaxCompute作业运维排序报错，如何解决？

咨询一下，我配置了MySQL实时同步到MaxCompute的任务，但MySQL数据更新后，MaxCo

大数据计算MaxCompute这个海外版什么时候可以体验到4.0啊?

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

2017杭州云栖大会FAQ（持续更新中）

【转载】时隔一年多，我又用起了 Superset

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

品《阿里巴巴大数据实践-大数据之路》一书（上）

阿里云MaxCompute 2019-5月刊

展开全部

还有其他疑问?