文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

SQL Runtime SLX中的优化设计有哪些？

已解决

SQL Runtime SLX中的优化设计有哪些？

展开

收起

游客lmkkns5ck6auu 2022-08-10 14:25:34 742 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客c3gxxcx6cqeyo

推荐回答
1. 框架结构合理划分: Runtime Streamline 和 Fuxi SDK 解耦，Runtime 负责数据处理逻辑，Fuxi SDK 负责底层数据流传输。代码可维护性，功能可扩张性，性能调优空间都显著增强；
2. 支持 GraySort 模式: Streamline Writer 端只分组不排序，逻辑简单，省去数据内存拷贝开销以及相关耗时操作，Reader 端对全量数据排序。整体数据处理流程 Pipeline 更加高效，性能显著提升；
3. 支持 Adaptive 模式: StreamlineReader 支持不排序和排序模式切换，来支持一些 AdaptiveOperator 的需求，并且不会产生额外的 IO 开销，回退代价小，Adaptive 场景优化效果显著；
4. CPU 计算效率优化: 对耗时计算模块重新设计 CPU 缓存优化的数据结构和算法，通过减少 cache miss，减少函数调用开销，减少 cpu cache thrashing，提升 cache 的有效利用率等手段，来提升运算效率；
5. IO 优化：支持多种压缩算法和 Adaptive 压缩方式，并重新设计 Shuffle 传输数据的存储格式，有效减少传输的 IO 量。 6. 内存优化: 对于 Streamline Writer 和 Reader 内存分配更加合理，会根据实际数据量来按需分配内存，尽可能减少可能产生的 Dump 操作。
以上内容摘自《“伏羲”神算》电子书，点击https://developer.aliyun.com/topic/download?id=873
2022-08-11 10:51:22

赞同展开评论

问答分类：

SQL 云原生大数据计算服务 MaxCompute

问答标签：

SQL优化 SQL runtime SQL设计 SQL slx

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

MaxCompute SQL报错encounter runtime exception whi...

335

1

0

如何让sql不走缓存呢，优化sql，想对比sql执行时间

1146

1

0

如何实现自动SQL 优化？

1040

1

0

PolarDB的自动SQL 优化是怎样的？

1391

1

0

现有的在线SQL 执行计划管理的路由设计中，路由时只有分别为执行一个已接受的计划和常规的基于代价的查

473

1

0

现有的在线SQL 执行计划管理的路由设计中，路由时只有两个选择，是哪两种选择？

414

1

0

SQL 执行计划管理需要考虑哪些因素才能优化整个负载的执行时间？

661

1

0

sql join之后数据膨胀导致反压有什么比较好的优化手段？

857

0

0

对于flink sql需要关联上10张表有什么好的优化吗

701

1

0

sql导入有什么优化方案吗？我们需要每日通过sql把mc外表导入到holo内做服务查询，但是导入数据

2499

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

阿里巴巴大数据计算

347743

+ 订阅

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析，将数据高效转换为业务洞察。

相关文章

MyBatis Plus 封神玩法：这12个操作让开发效率直接起飞！

执行计划中的“隐藏信息”：读懂optimizer trace，看透优化器的每一步决策

2026免费BI产品选择指南，真实测评与推荐

SQL Server迁移必看！深度解析SQLServer兼容性三大核心维度与选型指南

为什么我说PostgreSQL是Agent Database的最佳选择

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

请问下大数据计算MaxCompute dataworks是否有全局变量？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

咨询一下，我配置了MySQL实时同步到MaxCompute的任务，但MySQL数据更新后，MaxCo

大数据计算MaxCompute作业运维排序报错，如何解决？

在大数据计算MaxCompute中，这种多久能查询到？

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

优酷背后的大数据秘密

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

【转载】时隔一年多，我又用起了 Superset

展开全部

还有其他疑问?