开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

Streamline是什么?

已解决

Streamline是什么?

展开
收起
游客lmkkns5ck6auu 2022-08-10 14:24:42 571 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    在其他 OLAP 或 MPP 系统中,也有类似组件被称为 Shuffle 或Exchange,在MaxCompute SQL 中该组件涉及的功能更加完善,性能更优,主要包含但不限于 分布式运行的 Task 之间数据序列化,压缩,读写传输,分组合并,排序等操作。

    SQL 中一些耗时算子的分布式实现基本都需要用到这个模块,比如 join,groupby,window 等等,因此它绝对是 CPU,memory,IO 等资源的消耗大户,在大部分作业中运行时间占比整个 sql 运行时间 30% 以上,一些大规模作业甚至可以达到 60% 以上,这对于 MaxCompute SQL 日均近千万任务量,日均处理数据接近 EB 级的服务来说,性能每提升 1 个多百分点,节省的机器资源都是以上千台计,因此对该组件的持续重构优化一直是 MaxCompute SQL 团队性能提升指标的重中之重。

    2019 年双十一应用的 SLX 就是完全重写的高性能 Streamline 架构。

    以上内容摘自《“伏羲”神算》电子书,点击https://developer.aliyun.com/topic/download?id=873

    2022-08-11 10:50:25
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载