国产数据库-技术特性-CloudberryDB

简介: Cloudberrydb基于gpdb,支持PG14内核,有很多GP目前不支持的优秀特性

GreenPlum(GPDB)是一款基于PostgreSQL(PgSQL)的开源分布式数据库。目前GPDB7已发布beta4,PgSQL内核支持到了12.12,但PgSQL优秀内核特性比如并行查询仍旧不支持。经查询PgSQL中并行代码已存在于GPDB中,但执行计划生成这块却不支持。这就比较可惜了。现在有款国产分布式数据库CloudberryDB基于GPDB,继承了GPDB优秀特性,并兼容PgSQL14.4的内核,支持了很多GPDB不具备的特性。

1、CloudberryDB vs. GPDB7

1.1通用特性

特性名

说明

Cloudberrydb

GPDB7 beta3

Explain (WAL) support

在执行计划中显示SQL语句生成的WAL大小,PgSQL13中增加的特性

支持

不支持

Multiranges

PgSQL14引入支持

支持

不支持

B-tree bottom-up index deletion

PgSQL14引入支持

支持

不支持

Covering indexes for GiST (INCLUDE)

PgSQL12引入支持

支持

即将支持

The range_agg range type aggregation function

PgSQL14引入支持

支持

不支持

CREATE ACCESS METHOD

PgSQL12引入支持

支持

即将支持

LZ4 compression for TOAST tables

PgSQL14引入支持

支持

不支持

JSONB subscripting

PgSQL14引入支持

支持

不支持

Configure the maximum WAL retention for replication slots

PgSQL13引入支持

支持

不支持

Verify backup integrity (pg_verifybackup)

PgSQL13引入支持

支持

不支持

Client can require SCRAM channel binding

PgSQL13引入支持

支持

不支持

Vacuum "emergency mode"

PgSQL14引入支持

支持

不支持

Certificate authentication with postgres_fdw

PgSQL13引入支持

支持

不支持

UPSERT

--

支持

即将支持

COPY FROM Where

PgSQL12引入支持

支持

不支持

VACUUM / ANALYZE Skip Lock Table

PgSQL12引入支持

支持

不支持

HASH partitioned table

PgSQL11引入支持

支持

不支持

CTE(SEARCH and CYCLE)

PgSQL14引入支持

支持

不支持

Procedure OUT parameters

PgSQL14引入支持

支持

不支持

CHECK constraints for foreign tables

--

支持

不支持

Timeout parameter for pg_terminate_backend

PgSQL14引入支持

支持

不支持

Auto failover for Master

应该是自己开发的

支持

不支持

Kubernetes deployment support

应该是自己开发的

支持

不支持

1.2性能相关特性

特性名

说明

Cloudberrydb

GPDB7 beta3

REINDEX CONCURRENTLY

--

支持

不支持

Aggregation pushdown

--

支持

不支持

CREATE STATISTICS - OR and IN/ANY statistics

--

支持

不支持

Incremental sort

--

支持

不支持

Incremental sort for window functions

--

支持

不支持

Query pipelining

--

支持

不支持

BRIN Index(multi-minmax, bloom)

--

支持

不支持

Query parallelism

--

支持

不支持

Abbrevated keys for sorting

--

支持

不支持

Hash Index WAL support

--

支持

不支持

postgres_fdw aggregation pushdown

--

支持

不支持

No need to rewrite the whole table when adding a column

--

支持

不支持

Runtime Filter for Join

--

支持

不支持

Index Scan for the AppendOnly table

--

支持

即将支持

1.3安全相关特性

特性名

说明

Cloudberrydb

GPDB7 beta3

Transparent Data Encryption (TDE)

--

支持

不支持

Trusted extensions

--

支持

不支持

SCRAM-SHA-256

--

支持

不支持

Encrypted TCP/IP connection when GSSAPI

--

支持

不支持

Row-level security policy

--

支持

不支持

2、CloudberryDB向量化

2020年PostgreSQL中国技术大会上,Cloudberry提到进行了向量化技术探索。采用Apache Arrow作为其列存,基于此进行向量化引擎改造。

采用Arrow实现向量化执行的优势:零拷贝的列式计算引擎;适合向量执行的数据内存格式,便于SIMD指令使用;尽可能降低了列式数据做JIT的拆分和组合开销,优化器决定是否选择JIT。

当然它也是将向量化执行器做成了一个插件,尽量减少对内核的入侵。对各个算子进行了重写包括:Scan、Agg、Sort、Motion、Project。

不过这块HashData并没有开源。

3、参考

https://github.com/cloudberrydb/cloudberrydb

https://www.modb.pro/doc/100993

目录
相关文章
|
1月前
|
数据库 索引
深入探索数据库索引技术:回表与索引下推解析
【10月更文挑战第15天】在数据库查询优化的领域中,回表和索引下推是两个核心概念,它们对于提高查询性能至关重要。本文将详细解释这两个术语,并探讨它们在数据库操作中的作用和影响。
50 3
|
1月前
|
数据库 索引
深入理解数据库索引技术:回表与索引下推详解
【10月更文挑战第23天】 在数据库查询性能优化中,索引的使用是提升查询效率的关键。然而,并非所有的索引都能直接加速查询。本文将深入探讨两个重要的数据库索引技术:回表和索引下推,解释它们的概念、工作原理以及对性能的影响。
62 3
|
1月前
|
负载均衡 网络协议 数据库
选择适合自己的数据库多实例负载均衡技术
【10月更文挑战第23天】选择适合自己的数据库多实例负载均衡技术需要全面考虑多种因素。通过深入的分析和评估,结合自身的实际情况,能够做出明智的决策,为数据库系统的高效运行提供有力保障。
111 61
|
1月前
|
SQL 关系型数据库 数据库
国产数据实战之docker部署MyWebSQL数据库管理工具
【10月更文挑战第23天】国产数据实战之docker部署MyWebSQL数据库管理工具
111 4
国产数据实战之docker部署MyWebSQL数据库管理工具
|
1月前
|
SQL Java 数据库连接
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率。本文介绍了连接池的工作原理、优势及实现方法,并提供了HikariCP的示例代码。
48 3
|
1月前
|
缓存 负载均衡 监控
数据库多实例的负载均衡技术深入
【10月更文挑战第23天】数据库多实例负载均衡技术是确保数据库系统高效运行的重要手段。通过合理选择负载均衡策略、实时监控实例状态、不断优化调整,能够实现资源的最优分配和系统性能的提升。在实际应用中,需要根据具体情况灵活运用各种负载均衡技术,并结合其他相关技术,以满足不断变化的业务需求。
|
1月前
|
Java 数据库连接 数据库
优化之路:Java连接池技术助力数据库性能飞跃
在Java应用开发中,数据库操作常成为性能瓶颈。频繁的数据库连接建立和断开增加了系统开销,导致性能下降。本文通过问题解答形式,深入探讨Java连接池技术如何通过复用数据库连接,显著减少连接开销,提升系统性能。文章详细介绍了连接池的优势、选择标准、使用方法及优化策略,帮助开发者实现数据库性能的飞跃。
30 4
|
1月前
|
Java 数据库连接 数据库
深入探讨Java连接池技术如何通过复用数据库连接、减少连接建立和断开的开销,从而显著提升系统性能
在Java应用开发中,数据库操作常成为性能瓶颈。本文通过问题解答形式,深入探讨Java连接池技术如何通过复用数据库连接、减少连接建立和断开的开销,从而显著提升系统性能。文章介绍了连接池的优势、选择和使用方法,以及优化配置的技巧。
31 1
|
1月前
|
SQL Java 数据库连接
打破瓶颈:利用Java连接池技术提升数据库访问效率
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,避免了频繁的连接建立和断开,显著提升了数据库访问效率。常见的连接池库包括HikariCP、C3P0和DBCP,它们提供了丰富的配置选项和强大的功能,帮助优化应用性能。
53 2
|
2月前
|
存储 SQL NoSQL
数据库技术深度探索:从关系型到NoSQL的演变
【10月更文挑战第21天】数据库技术深度探索:从关系型到NoSQL的演变
60 1