文档备案控制台

开发者社区大数据与机器学习正文

我现在基于Hologres引擎搭建了一套自动化数据分析平台，其中sql是自动生成的，当sql较复杂？

问题1:我现在基于Hologres引擎搭建了一套自动化数据分析平台，其中sql是自动生成的，当sql较复杂时，执行会比较慢，有大佬可以指导一下吗？问题2:这个问题很大呀。。

方法论上一般就是先通过query log找到慢的sql https://help.aliyun.com/document_detail/216963.html?spm=a2c4g.183398.0.i2

然后根据query log里展示的plan和调优文档去对比，看是不是符合调优文档的某些bad case https://help.aliyun.com/document_detail/183398.html?spm=a2c4g.162563.0.0.5bc63f68R5OGsR这个问题是有点大，主要原因在于我的sql是自动生成的，无法按照具体物理表的情况取调优所以找慢sql和单独表的调优对我不是太适用，是想看看有没有标准的优化方案，sql/user分级是怎么做的，这块不太了解，sql之间相互干扰这个暂时不存在，因为并发还比较少，主要是单sql的优化，我现在单独运行一个复杂sql需要花费1.5秒左右，能优化到500ms是最好的

展开

收起

真的很搞笑 2023-05-16 17:39:08 455 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

回答1:有个文档，可以参考看看： https://help.aliyun.com/document_detail/183398.html?spm=a2c4g.461881.0.0.79926a8f05san2 还有就是把explain analyze <最关键的慢sql>; 的结果发出来看看。回答2:优化有修改物理表的属性，也有修改sql。

你可以看看是不是靠前者就能提升性能。可以针对下sql/user进行分级？控制下影响面？比如两实例，一个是识别过比较稳定的sql, 一个是跑未知的。我理解你提到的事情可能包含两部分： 1. 降低sql之间相互干扰 2. 真正慢sql优化。如果想要降低sql之间干扰，可以考虑：将比较复杂sql(简单点判断下长度超过阈值)或按user路由到一个独立的实例(只读实例）, 减少user与user之前的干扰，以及bad sql影响正常的sql？优化sql层面, 比较通用是扩大资源，其它可以请教下 @上唐看看有没有什么好的想法。，此回答整理自钉群“实时数仓Hologres交流群”

2023-05-16 17:49:00

赞同展开评论

问答分类：

SQL 数据挖掘实时数仓 Hologres

问答标签：

自动化平台实时数仓 Hologres平台数据分析平台 SQL数据分析 hologres数据分析

问答地址：

开发者社区 > 大数据与机器学习 > 问答

相关问答

hologres在服务里用psycopg2连接Holo，不定时进行sql查询，跑一会连接就断开了?

428

1

0

FBI平台在性能数据分析中有何特殊作用？

867

1

0

快手在实时数仓开发中为什么选择在某些场景使用API而不是SQL？

258

1

0

钉钉连接平台支持sql server吗？

329

1

0

应用运维平台如何与监控和自动化变更流程结合？

256

1

0

在实时数仓Hologres中有些sql, where条件里只有多字段in , 这个能优化吗？

260

0

0

DataWorks中hologres sql节点里遇到一个oom的报错？

157

0

0

在Flink CDC中，flink sql开发都用的什么平台呀？

211

0

0

用sql检查实时数仓Holo自动加载时，报错是为什么？

188

1

0

检查实时数仓Holo自动加载是否开启的sql是什么？

217

1

0

大数据与机器学习

大数据领域前沿技术分享与交流，这里不止有技术干货、学习心得、企业实践、社区活动，还有未来。

我要提问

相关文章

AI驱动的攻击怎么防？用IP风险画像在攻击链路早期阻断C2通信

SQL Server迁移必看！深度解析SQLServer兼容性三大核心维度与选型指南

为什么我说PostgreSQL是Agent Database的最佳选择

4D Gaussian Splatting 是怎么工作的：从规范 Gaussian 到形变场的原理拆解

相关解决方案

更多

构建实时/离线一体化数据分析平台

基于 Hologres 的广告创投一体化

一站式搭建短剧平台

HappyHorse 打造一站式影视创作平台

漫剧工坊：一站式动画创作平台

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

flinkcdc在IDEA运行正常，打包就报错

在DataWorks上使用PyODPS使用限制是什么？

Flink CDC 能适配达梦不？

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

有用flink cdc同步mysql到hive这样搞过的源码吗?

展开全部

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

你刚吃的兰州牛肉面，背后就藏着大数据

大数据环境下该如何优雅地设计数据分层

odps是什么?

ajax请求总是不成功？浏览器的同源策略和跨域问题详解

【技术实验】mysql准实时同步数据到Elasticsearch

数据仓库介绍与实时数仓案例

分布式快照算法: Chandy-Lamport

DataV接入ECharts图表库可视化利器强强联手

MaxCompute执行作业慢的原因排查

展开全部

还有其他疑问?