云原生数据仓库AnalyticDB MySQL湖仓版架构升级,持续释放技术红利!

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
简介: 云原生数据仓库AnalyticDB MySQL湖仓版架降价23%!持续提供高性价比的产品服务


【先打一波小广告】

AnalyticDB MySQL和Intel联合推出基于ADB Spark的训练营,ADB新用户参营可获得价值100元的权益包!
点击前往参加




无论是数据湖中的非结构化或半结构化数据,还是数据库中的结构化数据,企业都可使用AnalyticDB MySQL版构建数据分析平台,完成高吞吐离线处理和高性能在线分析,快速将企业的关键指标实时可视化展示,完成高吞吐离线处理和高性能在线分析的同时,实现降本增效。

AnalyticDB MySQL湖仓版可无缝替换,CDH/TDH/Databricks/Presto/Spark/Hive等。


🎉 🎉 🎉2023年10月份以来湖仓版ACU(1C4G)单价全面下调23%160元/月下降到 140元/月0.37元/小时下降到 0.3元/小时


具体福利详见文末!

产品介绍


随着业务客户数增长、业务复杂度变高、存量数据积累等原因,数据规模从GB级增长到接近PB级,数据格式也从TP数据源为主的结构化数据,增加了很多半结构化(JSON等)、非结构化数据。客户通常会先在数据湖中做离线处理,对数据进行清洗、过滤、规整等预处理,再通过数据同步工具,将数据同步到数据仓库AnalyticDB中做在线分析。

数据一旦在多个系统间进行同步,就难免会因为数据同步工具的稳定性,带来数据一致性、时效性、数据冗余等问题。比如「数据工程师」在数据湖中看到的ADS表,和「数据分析师」在数据仓库中看到的ADS表的数据可能是不一样的。

阿里云数据仓库AnalyticDB MySQL版针对目前数据仓库和数据湖割裂的体系导致体验、系统复杂度、数据一致性和成本等各方面的挑战,在AnalyticDB MySQL作为数据仓库的基础上推出了AnalyticDB MySQL湖仓版,帮助客户可以同时使用数据仓库和数据湖中的数据自由平衡性价比,并且保持全过程同一体验和数据一致性。

阿里云数据仓库AnalyticDB版湖仓版在数仓版的能力基础上,从数据的采集、存储、计算和应用等方面做了全面的升级。湖仓版是基于计算存储分离架构打造的,同时具备低成本离线处理和高性能在线分析能力的湖仓一体版本,提供将源端数据实时同步到湖(Hudi on OSS)或仓(C-Store)的可视化配置能力。通过底层存储的一份全量数据,来支持离线和在线两种场景,避免因数据同步产生的数据一致性和时效性等问题。计算层支持标准接口的多语言可编程计算引擎Spark。同时湖仓版提供离线业务与在线业务的计算资源物理隔离的能力,能实现计算资源和存储资源按需弹性扩容。


下图是AnalyticDB MySQL湖仓版的技术架构图:

湖仓版支持从RDS/SLS/Kakfa等不同的数据源采集数据,让数据方便地进入湖仓存储。在存储和计算层,湖仓版同时支持自研引擎(「羲和计算引擎」和「玄武存储引擎」)和开源引擎(「Spark计算引擎」和「Hudi存储格式」),一方面借助开源的能力提供更丰富的数据分析场景,另一方面打通了自研和开源之间的互相访问,提供更一体化的体验。



做深自研:融合引擎满足多种场景


存储层:只需一份全量数据,满足离线在线场景

离线场景和在线场景对数据存储的诉求不一致,如何让一份全量数据同时实现高性能在线分析和低成本离线处理,是一大挑战。在线分析场景希望数据尽量在高性能存储介质上提高性能,离线处理希望数据尽量在低成本存储介质上降低存储成本。

为此,湖仓版首先将一份全量数据存在低成本高吞吐存储介质上,低成本离线处理场景直接读写低成本存储介质,降低数据存储和数据IO成本,保证高吞吐;其次将实时数据存在单独的存储IO节点(EIU)上,保证「行级」的数据实时性,同时对全量数据构建索引,并通过Cache能力对数据进行加速,满足百ms级高性能在线分析场景。

湖仓版的「一份数据」方案,很好地解决了因为数据同步带来的数据一致性和数据时效性问题。


计算层:融合计算引擎

在计算层,自研的「羲和计算引擎」MPP模式用来支撑数据的高性能在线分析。但这种流式计算模式并不适合离线处理低成本和高吞吐的特点。因此,湖仓版在「羲和分析计算引擎」中新增加了BSP模式,通过DAG进行任务切分,分批调度,满足有限资源下大数据量计算,支持计算数据落盘。进一步,由于考虑到MPP模式和BSP模式对普通用户存在较高的理解和学习成本,「羲和计算引擎」被升级成「羲和融合计算引擎」,同时提供MPP模式和BSP模式,并计划提供自动切换能力。


极致弹性:千核秒级弹性能力,完美贴合业务负载

云原生的最大优势就是弹性,湖仓版具备弹得起弹得快弹得好三个特点,贴合业务负载,保证查询性能。弹得起是指通过神龙+ECS/ECI构建的两层管控底座,提供更充足的库存保证,资源交付率超过95%;弹得快是通过资源池化、缓存加速等技术,弹性启动效率在10s内;弹得好是提供不同的弹性模型,满足客户的分时弹性和按需灵活弹性的业务场景。湖仓版在9月份推出了新的计算弹性模型Multi-Cluster,该弹性模型作用在AnalyticDB MySQL在线资源组内部,一个在线资源组由一个或者多个Cluster组成,相比普通在线资源组,在易用性、性能和成本上均有了较大提升,可有效应对查询的高并发实时分析场景。



拥抱开源:相比开源性能提升2.7倍

阿里云数据库仓库AnalyticDB MySQL湖仓版积极拥抱开源,满足已经生长在开源生态上的客户可以更平滑地使用湖仓版。外表类型,在Parquet/ORC/JSON/CSV等Append类型数据格式的基础上,新增支持批量更新的Hudi数据格式,帮助用户更好地低成本接入如CDC等数据。计算引擎,在做深「羲和融合计算引擎」的基础上,新增开源活跃度较高的Spark引擎,满足用户对于复杂离线处理和ML机器学习等需求。 AnalyticDB MySQL湖仓版提供了全托管的Spark能力,同开源Spark相比,具备如下优势:

 平滑迁移:采用开源Spark内核,接口和功能100%兼容;

 性能:通过数据缓存、向量化执行、下推优化等,相比开源同版本,10TB TPC-H测试场景下性能提升2.7倍;

成本:提交Spark Job才会触发资源的申请,满足业务波峰波谷对资源弹性的需求,降低资源成本;

高效入仓:使用Storage API替代传统JDBC方式,入仓速度提升5倍

生态增强:提供开箱即用的Notebook能力,当前支持SQL/Python/Scala语言来满足不同工程师的开发需求。拥抱开源不仅仅是简单集成Spark/Hudi/Delta等开源引擎,还包括湖仓库表元数据管理,以便多引擎共享,为此AnalyticDB还提供了统一元数据服务管理湖仓库表元数据,湖仓中的元数据/权限可互通,不同引擎可自由访问湖仓数据而无需重复创建元数据。对于湖仓数据,为屏蔽底层数据存储格式的差异,便于第三方引擎集成,AnalyticDB提供了面向内存列存格式Arrow的Lakehouse API服务,提供统一的读写能力,满足业务对仓存储有大吞吐的诉求,对于仓存储已经通过Arrow格式完成Spark引擎对接。



优势总结

阿里云数据库仓库AnalyticDB MySQL湖仓版的优势可以用程序员最熟悉的数字「1024」进行总结。

1: 是指一份数据,避免数据同步带来的数据一致性、时效性、冗余等问题;

0: 是指灵活弹性,用Serverless的方式贴合业务负载,保证查询性能,降低资源成本;

2: 是指湖仓版同时满足低成本离线处理和高性能在线分析;

4: 是指4个统一,统一计费单位、统一数据管道、统一数据管理、统一数据访问。


近期大降价福利

云原生数据仓库AnalyticDB MySQL版(湖仓版),2023年10月开始,ACU(1C4G)单价全面下调23%: 包年包月ACU单价 从160元/月下降至140元/月按量付费ACU单价 从0.37元/小时下降至0.3元/小时新版定价请点击文末「阅读原文」查看湖仓版3.0定价文档,如有疑问,欢迎入群咨询,钉钉搜索群号:33600023146



👇👇👇




 


相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
2天前
|
人工智能 关系型数据库 MySQL
AnalyticDB MySQL版:云原生离在线一体化数据仓库支持实时业务决策
AnalyticDB MySQL版是阿里云推出的云原生离在线一体化数据仓库,支持实时业务决策。产品定位为兼具数据库应用性和大数据处理能力的数仓,适用于大规模数据分析场景。核心技术包括混合负载、异构加速、智能弹性与硬件优化及AI集成,支持流批一体架构和物化视图等功能,帮助用户实现高效、低成本的数据处理与分析。通过存算分离和智能调度,AnalyticDB MySQL可在复杂查询和突发流量下提供卓越性能,并结合AI技术提升数据价值挖掘能力。
23 16
|
2天前
|
存储 数据采集 Cloud Native
极速数仓ClickHouse步入云原生新纪元
极速数仓ClickHouse步入云原生新纪元,由ClickHouse核心研发团队技术总监王鹏程及长桥航行服务架构负责人刘文全主讲。内容涵盖ClickHouse的优势与应用场景、架构解析、最佳实践及未来展望。特别介绍了ClickHouse Enterprise版本在阿里云上的优化与创新,支持实时查询、高性能资源利用和丰富的SQL扩展。长桥证券分享了其基于阿里云ClickHouse构建行情服务的实践经验,展示了如何通过ClickHouse实现高效的数据存储与处理,显著降低存储成本并提升写入性能。
|
5月前
|
存储 运维 Cloud Native
"Flink+Paimon:阿里云大数据云原生运维数仓的创新实践,引领实时数据处理新纪元"
【8月更文挑战第2天】Flink+Paimon在阿里云大数据云原生运维数仓的实践
303 3
|
6月前
|
Cloud Native 关系型数据库 MySQL
云原生数据仓库使用问题之如何将ADB中的数据导出到自建的MySQL数据库
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
6月前
|
存储 SQL Cloud Native
云原生数据仓库使用问题之运行MySQL命令发现中文内容变成了问号,该如何解决
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
1月前
|
运维 Cloud Native 持续交付
深入理解云原生架构及其在现代企业中的应用
随着数字化转型的浪潮席卷全球,企业正面临着前所未有的挑战与机遇。云计算技术的迅猛发展,特别是云原生架构的兴起,正在重塑企业的IT基础设施和软件开发模式。本文将深入探讨云原生的核心概念、关键技术以及如何在企业中实施云原生策略,以实现更高效的资源利用和更快的市场响应速度。通过分析云原生架构的优势和面临的挑战,我们将揭示它如何助力企业在激烈的市场竞争中保持领先地位。
|
1月前
|
Kubernetes Cloud Native 微服务
探索云原生技术:容器化与微服务架构的融合之旅
本文将带领读者深入了解云原生技术的核心概念,特别是容器化和微服务架构如何相辅相成,共同构建现代软件系统。我们将通过实际代码示例,探讨如何在云平台上部署和管理微服务,以及如何使用容器编排工具来自动化这一过程。文章旨在为开发者和技术决策者提供实用的指导,帮助他们在云原生时代中更好地设计、部署和维护应用。
|
2月前
|
Cloud Native Devops 云计算
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
64 3
|
2月前
|
Cloud Native 持续交付 云计算
云原生架构的演进与挑战
随着云计算技术的不断发展,云原生架构已成为企业数字化转型的重要支撑。本文深入探讨了云原生架构的概念、发展历程、核心技术以及面临的挑战,旨在为读者提供一个全面了解云原生架构的视角。通过分析Kubernetes、Docker等关键技术的应用,以及微服务、持续集成/持续部署(CI/CD)等实践案例,本文揭示了云原生架构在提高应用开发效率、降低运维成本、增强系统可扩展性等方面的显著优势。同时,也指出了云原生架构在安全性、复杂性管理等方面所面临的挑战,并提出了相应的解决策略。
|
2天前
|
人工智能 编解码 自然语言处理
AI运用爆发时代, 视频服务云原生底座“视频云”架构的全智能再进化
本文介绍了AI运用爆发时代下,视频服务云原生底座“视频云”架构的全智能再进化。随着AI技术的发展,视频内容和交互方式正经历深刻变革。文章从背景、视频AI应用挑战、视频云网端底座、AIGC时代的全智能化及未来展望五个方面展开讨论。重点阐述了云、网、端三者如何深度融合,通过AI赋能视频采集、生产、分发和消费全流程,实现视频处理的智能化和高效化。同时,展望了未来AI在视频领域的创新应用和潜在的杀手级应用。

相关产品

  • 云数据库 RDS MySQL 版