看云栖说云栖—— 从 DB 到 BD 的桥梁

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 要做大数据?不妨先看看阿里云分析型数据库。

必须认识到,我国社会主要矛盾的变化,没有改变我们对我国社会主义所处历史阶段的判断,我国仍处于并将长期处于社会主义初级阶段的基本国情没有变,我国是世界最大发展中国家的国际地位没有变。
—— 《十九大报告》

拜软硬件技术的发展所赐,很大一部分想要做“大数据”的用户,现在用阿里云分析型数据库(ADS)其实就已经够用了。
本文内容取自2019年杭州阿里云栖大会《下一代云数据分析专场》。

趋势分析和产品发布,趋势有这些:

  • 市场趋势:2020年全球数据规模约为40zB,2025年要增长430%;2023年,75%的数据库都在云上;2022年新业务将会采用实时分析的比例达到50%
  • 技术趋势:从单机进化到分布式架构;OLTP(在线事务处理)和OLAP(在线数据分析)将融合,HTAP(离线分析和在线数据处理混合负载)成为主流;支持多可用区的大规模扩展、支持极速恢复和复制,数据分析也要云原生;结构化数据和非结构化数据将能够融合分析;云边一体化的数据分析将覆盖边缘计算节点;云分析产品架构从使用传统硬件到使用软硬件一体化的架构

发布了两个产品,其中一个是基于MySQL的AnalyticDB from MySQL 3.0(ADS for MySQL),有这些更新:

  • 云原生架构,基于容器技术
  • MySQL兼容性提升
  • 支持从GB级升级到100PB级
  • 写入性能提升50%、查询性能提升40%。
  • 读写强一致,写入数据立即可见
  • 数据更可靠,支持只读实例,同城容灾。

还有一个是基于PostgresSQL的AnalyticDB for Greenplum 6.0版本(ADS for PostgreSQL),这个产品目前正在公测中,12月30日结束公测并正式商用,这个版本的更新有这些:

  • HTAP混合负载、支持更高并发,更快写入和更新性能,典型 OLTP 场景 TPC-C 达到 10w tpmc;Sysbench 支持 select 15w tps, insert 5w tps,update 2w tps。支持全局死锁检测。
  • 更多新特性、针对数仓中的维度表,通过建立复制表(DISTRIBUTED REPLICATED clause),可以大量减少数据传输,提升查询效率;ZSTD压缩算法,较之前 zlib 压缩算法,提升三倍的压缩和解压性能。

Greenplum 6.0到底有哪些升级?还是由Greenplum的开发者来来说说吧,阿里邀请到了来自Pivotal 的Greenplum 研发总监姚延栋做了《全新的Greenplum 6.0 内核优化解读和7.0展望》的演讲。
Greenplum6.0使用PostgreSQL 9.4内核,主要有以下改善:

  • HTAP性能提升,OLTP的性能提升70倍,支持更多的数据类型和SQL特性(大表关联、分组聚集、窗口函数、JSON),让Greenplum从一个OLAP数据库变成了真正可用的HTAP数据库
  • 全新高可用机制、使用PostgreSQL原生的流复制技术,网络开销低。
  • 弹性、支持在线不停机扩容。
  • 支持和机器学习平台集成、包括MADlib、TensorFlow、提供原生R语言支持。

在客户分享环节,阿里云邀请到了在国内排名第三的手机游戏公司莉莉丝(刀塔传奇的开发商,第一名腾讯、第二名网易)做了名为《利用ADB打造游戏行业新一代实时数据运营平台》的演讲。
莉莉丝原来使用复杂的大数据平台进行数据分析,后来切换到ADS,主要原因是:

  • 快、比POLARDB这种OLTP快10倍以上(OLAP场景),比presto也能快数倍,QPS数百到上万。
  • 灵活、节点和配置都可以随时升降,可以随着数据增长逐步升级。
  • 易用、从presto迁移过来,计划没有任何改动成本,mysql迁移大部分语句兼容。
  • 规模扩展、动态弹性扩容至数千节点,可以支撑我们到达腾讯的量级
  • 高并发、从10万TPS到数百万TPS,都可以支撑。

支持MySQL/PostgreSQL语法、可以快速上手、能支撑一个手游公司的大数据平台达到腾讯的量级,还能兼顾在线事务处理。​我想,大多数公司做大数据,阿里云ADS就够用上好一阵子了吧。

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
目录
相关文章
|
关系型数据库
|
Ubuntu 关系型数据库 Unix
从小白到专家 PG 技术大讲堂 - Part 1:PG 简介
从小白到专家 PG 技术大讲堂 - Part 1:PG 简介
261 2
|
Cloud Native 关系型数据库 数据库
【DB吐槽大会】第36期 - PG 没有官方插件市场
大家好,这里是DB吐槽大会,第36期 - PG 没有官方插件市场
|
存储 分布式计算 Cloud Native
PG中国开发者社区—占超群PG峰会专访
占超群,花名离哲,阿里云智能数据库产品事业部OLAP产品线负责人。
588 0
|
SQL 运维 Kubernetes
蚂蚁金服 DB Mesh 的探索与实践
本篇文章通过介绍当前蚂蚁金服数据访问层遇到的问题、解决的思路、演进的方向三个方面,期望能够阐述 DB Mesh 发展的一些思考让更多同学认识 DB Mesh。
1745 0
|
存储 弹性计算 容灾
PG中国开发者社区—周正中PG峰会专访
周正中,阿里云数据库产品经理。
4245 0
|
Cloud Native NoSQL 关系型数据库
PG中国开发者社区—叶正盛PG峰会专访
叶正盛,阿里巴巴集团资深产品专家、阿里云智能数据库产品管理与运营负责人。
5293 0
|
存储 Oracle 关系型数据库
【PG云栖周刊】第2期·PostGIS北京3月活动,存储扩展引擎zheap,Oracle兼容性之 - 数据类型
3月17-18 PG象行中国2018-地理信息处理GIS专题(北京站),活动地点:北京师范大学 艺术楼 201教室;PostgreSQL最新存储扩展引擎zheap,计划加入到PG12;PostgreSQL 10.3更新版本发布;云数据库PPAS Oracle兼容性 - 数据类型;PostgreSQL中HOOK的使用,避免误删库的问题。
5128 0
【PG云栖周刊】第2期·PostGIS北京3月活动,存储扩展引擎zheap,Oracle兼容性之 - 数据类型
|
关系型数据库 数据库 PostgreSQL
【PG云栖周刊】Alpha#01 | 2018年02月04日
DB-Engines 2018年2月全球排行PostgreSQL稳居第4位;PostgreSQL全球开发组于布鲁塞尔会面;PostgreSQL 11 多个预览功能发布,单实例100亿TOP-K仅40秒;ADAM将数据库迁移评估时间从2个月缩短到1周;VACUUM或许在未来将从PG中消失。
3587 0
【PG云栖周刊】Alpha#01 | 2018年02月04日
|
SQL Oracle 关系型数据库
【PG云栖周刊】Alpha#00 | 2018年01月27日
每周为您汇总 PostgreSQL 全球及中国的最新业界信息,我们不是权威,我们是连接你与PostgreSQL世界的桥梁。立足中国,连接全球 -- “PostgreSQL 2018 腾飞吧,大象!”
4217 0
【PG云栖周刊】Alpha#00 | 2018年01月27日