2019,数据库行业迎50年第二次巨变

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 一场数据库的世纪之战,在所难免。

数据库与中间件和操作系统并列为全球三大基础软件技术,也是企业IT系统必不可少的核心技术,银行、电信、制造、互联网等所有行业都依赖于数据库技术。由于其技术的高难度,数据库长期以来被少数公司控制了绝大部分市场份额。据不同的统计口径,全球数据库市场在300亿美金到600亿美金之间,商用数据库的领导厂商主要是Oracle、微软、IBM和SAP。

自1968年IBM推出了第一代数据库DB1以及1970年IBM工程师Edgar Codd写下了最早的关系型数据模型构想的论文,随后的30年间出现了著名的数据库公司Oracle(1977年成立)、Informix(1980年成立,后被IBM收购)、Sybase(1984年成立,后被SAP收购)、Sybase与微软合作的SQL Server(后由微软接管)等,全球数据库产业在2000年前后进行了第一次大战并主要形成IBM、微软、Oracle三巨头格局。

2000年以后的互联网和云计算技术变革,为数据库技术带来了“釜底抽薪”的底层计算系统变化,导致了以开源、分布式和云计算为主导的新数据库时代。2012年Google发布论文首次对外介绍了自研的具有划时代意义的Spanner全球分布式数据库、2014年AWS推出了云原生关系型数据库Aurora、2017年阿里云推出云原生关系型数据库POLARDB,2018年10月Gartner全球数据库魔力象限的领导者和挑战者象限出现了7强格局:微软、Oracle、SAP、AWS、Google、IBM和阿里云。

2019年3月21日的2019阿里云峰会·北京上,阿里云发布了POLARDB的2.0版本,实现了首次兼容Oracle数据库,可帮助金融、医疗、制造等大型企业在数小时内完成业务迁移。除阿里云外,其它国内云厂商也相继推出了自研的云数据库和分布式数据库产品。2019新年伊始,数据库产业50年的第二次“世界大战”已经硝烟四起。

电商巨头的技术溢出效应

从Gartner的2018全球数据库魔力象限来看,AWS与阿里云是两大电商巨头的对外技术输出平台,AWS与阿里云都推出了种类丰富的数据库产品。而Google虽然是全球互联网技术和云技术的“大牛”,但Google内部技术的对外商用化输出往往晚于市场,Cloud Spanner就是直到2017年才向市场推出。

过去十年,电商巨头的技术溢出效应十分明显。AWS目前已经推出的数据库产品包括Amazon DynamoDB(非关系型文档和键值数据库)、Amazon ElastiCache (提供Redis和Memcached开源分布式缓存数据库) 、Amazon Neptune(图数据库)、Amazon Elastic MapReduce(EMR)Hadoop发行版,以及Amazon Relational Database Service(Amazon RDS,支持Amazon Aurora、MariaDB、Microsoft SQL Server、MySQL、Oracle和PostgreSQL等的云数据库服务)以及云原生数据库Amazon Aurora for MySQL and PostgreSQL等。

而阿里云已经推出的数据库产品包括ApsaraDB for RDS(关系型云数据库服务,支持MySQL即AliSQL、SQL Server、PostgreSQL、Redis等)、PolarDB(云原生数据库,支持MySQL、PostgreSQL、Oracle)、HybridDB for MySQL and PostgreSQL(云数据仓库)、Elastic MapReduce for Hadoop、HiTSDB(时序数据库)、X-DB(分布式数据库)、GraphDB(图数据库)等,此外阿里云Apsara Stack还支持企业本地化私有云部署。

无论是AWS还是阿里云,所提供的数据库及数据服务种类繁多,覆盖了绝大多数用户场景,特别是由于电商交易系统的特殊性,AWS和阿里云等开发了支持数据强一致的交易型分布式数据库,能够满足金融类业务的苛刻需求,而成本则远低于商业数据库。

为什么电商企业如此孜孜不倦的钻研数据库呢?以阿里云为例。阿里最早从淘宝、天猫等电商业务发展起来,当时采用的就是IBM DB2和Oracle商用数据库,支持了早期淘宝、天猫的快速发展,这是阿里数据库发展第一个阶段。到了2011和2012的时候,双11开始上规模,业务高速发展对传统的Oracle企业级数据库解决方案提出了挑战,成本太高是首当其冲的挑战,其次当电商业务逻辑变复杂以后,需要理解Oracle数据库的技术实现,以便从根本上解决业务极限场景的挑战,但无论是请Oracle专家到现场的时间还是成本都无法满足业务要求,阿里巴巴从2012、2013年后就开始大规模使用开源数据库,这是阿里数据库发展的第二阶段。第三个发展阶段就是云时代,阿里云的业务快速发展要求自研云原生数据库,这就是POLARDB的诞生逻辑;以及在阿里集团业务中,传统用中间件进行开源数据库分为分表的解决方案也不能满足业务要求,这就是X-DB的的诞生逻辑。

简单来说,电商企业的技术溢出是被业务倒逼的结果。阿里电商双十一场景,在世界范围内来看都绝无仅有,这也给了中国电商企业登顶全球基础软件技术领导地位的机会。作为全球绝无仅有的高并发挑战,阿里分布式技术经过双十一极限流量洪峰的实战考验,这也是为什么阿里云能够首次代表中国厂商冲入Gartner全球数据库魔力象限。2018年,美国犹他大学计算机系终身正教授、世界级数据库系统专家李飞飞,正式加入阿里巴巴,任数据库产品事业部负责人以及达摩院任数据库首席科学家,他于2018年底入选了2018 ACM杰出科学家。李飞飞门下弟子遍布全球所有顶尖企业的数据库部门,但李飞飞自己却选中了阿里,其主要原因就是阿里的全球独一无二的业务场景。

云厂商集开源技术大成

(阿里达摩院数据库首席科学家李飞飞)

2019年是阿里云十周年、AWS进入第13个年头。云厂商对于开源技术的集大成,正在进入全新的阶段。2014年AWS发布Amazon Aurora的时候,当时称性能与商用数据库相当,但成本只有商用数据库的1/10。而2017年阿里云推出POLARDB的时候,在100TB的数据容量上提供了10倍于传统商业数据库的性价比,如今性能达到AWS Aurora的2倍。

不可否认,阿里云的数据库发展离不开Google和AWS等前辈的指引。谷歌最早提出了Spanner,可以实现跨数据中心的数据强一致性,这在当时是跨时代的技术,但谷歌其实是巧妙的利用了原子钟的硬件解决方案;PostgreSQL的XC/XL开源分布式数据库使用的是GTM(Global Transaction Manager)解决方案。阿里云的X-DB则采用了混合逻辑来解决分布式事务处理和查询,已经支持了几乎阿里集团所有海量数据高并发的场景。

如今,阿里云正在把多个领先的数据库技术融合起来,以满足客户的更多、更高需求。云原生数据库POLARDB采用了存储计算分离、软硬件一体化设计,通过高速的RDMA网络提供共享存储的架构,可以快速实现弹性缩扩容,单个实例可扩展到1000核计算能力、同时可以横向扩展到100TB存储空间,满足大规模业务场景的需求,2.0版本则兼容Oracle。据了解,POLARDB与X-DB的优势即将融合成一体,也就是即将推出的POLARDB分布式版本。

即将推出的POLARDB分布式版本是在POLARDB共享存储、一写多读的架构上结合X-DB的核心分布式技术,这样企业就可以利用X-DB的分库分表强一致分布式技术挂起多个POLARDB实例,支持几乎无限的水平规模拓展,满足企业级上百个节点高并发业务需求。POLARDB分布式版本的推出,将用一个通用商业数据库产品来满足公共云上大中小企业的需求以及线下企业级超大规模用户的需求。这款产品最大的好处之一,在于底层接入的不是单节点数据库,而是分布式共享存储且单机支持100T,这样一个200T的数据库只需要两个POLARDB实例即可,大幅降低了跨分区处理的可能性。

POLARDB分布式版本这样一个集大成的通用型全场景覆盖数据库产品,当前阿里云已经储备了足够的技术和实践,现在的主要工作是产品化、标准化,以便能够快速规模化部署。李飞飞认为,阿里巴巴在分布式数据库的某些领域和某些维度上,可能超过像谷歌这样公司在分布式领域的积累,这是因为任何技术都是业务推动衍生出来的,只要有业务场景就能推动其技术从跟随发展到后发领先。

除了分布式和云原生数据库技术外,李飞飞所带领的团队还专注于数据库生态工具库,也就是开发各种辅助工具帮助客户用好数据库。阿里云的一个数据库生态工具就是针对混合数据库和混合云之间的数据迁移工具ADAM,可以大幅减少不同类型数据库和云部署之间数据迁移的各种消耗和对业务的冲击;另一个工具是混合数据库管理,可以管理A/B数据库、云上和云下数据库等混部架构,满足业务对混部数据库的访问和统一控制管理需求。

据了解,阿里云数据库很快将在2019年SIGMOD大会上介绍阿里云双十一场景下的分布式数据库架构。此前,谷歌Spanner、AWS Aurora等都是首先在SIDMOD会议上发布。而阿里云将登陆2019年SIGMOD会议,这也代表了中国技术厂商的成就。

展望未来几年,全球数据库市场将迎来50年的第二次巨变。在2018 Gartner全球数据库魔力象限的7强格局中,AWS、阿里云和Google为开源技术厂商,微软、Oracle和IBM也大举支持开源技术。Gartner预计,开源数据库将在2019年占据20%的数据库市场份额,而到2023年75%的数据库都将登陆云平台。一场数据库的世纪之战,已经在所难免。(文/宁川)

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
8月前
|
数据库
数据库第二次作业 表的约束
数据库第二次作业 表的约束
41 0
|
1天前
|
缓存 关系型数据库 MySQL
【深入了解MySQL】优化查询性能与数据库设计的深度总结
本文详细介绍了MySQL查询优化和数据库设计技巧,涵盖基础优化、高级技巧及性能监控。
11 0
|
28天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
58 3
|
28天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
70 3
|
28天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
87 2
|
1月前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
264 15
|
1月前
|
SQL 关系型数据库 MySQL
数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。
|
1月前
|
关系型数据库 MySQL 数据库
数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
|
1月前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
|
2月前
|
关系型数据库 MySQL 数据库
GBase 数据库如何像MYSQL一样存放多行数据
GBase 数据库如何像MYSQL一样存放多行数据

热门文章

最新文章