ClickHouse性能测试-阿里云开发者社区

ClickHouse性能测试

2022-09-01 324

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： ClickHouse性能测试

ClickHouse简介

ClickHouse是战斗民族Yandex公司出品的OLAP开源数据库，简称CH，也有人简称CK，是目前市面上最快的OLAP数据库。性能远超Vertica、Sybase IQ等。

CH具有以下几个特点：

列式存储，因此数据压缩比高。
向量计算，且支持多核CPU并行计算，并且执行每个SQL时都力求榨干CPU性能。
基于Shared nothing架构，支持分布式方案。
支持主从复制架构。
兼容大部分SQL语法，其语法和MySQL尤其相近。
数据实时更新。
不支持事务，不适合高频更新数据。
建议多用宽表，但不建议总是查询整数据行中的所有列。

简言之，如果你有以下业务场景，可以考虑用CH：

海量数据，但又不希望单节点的存储空间消耗太高。
宽表，为了业务方便，可能会把很多相关数据列都整合到一个表里。
基于SQL的查询方式，提高程序的适用性和可移植性。

性能测试

我选用了CH官方提供的一个测试方案：SSBM (Star Schema Benchmark)。

测试机配置：

腾讯云CVM主机
- 标准型S5机型
- 4核16G
- 外挂500G SSD云硬盘

数据盘采用xfs文件系统，ioscheduler采用deadline方式：

[root@yejr.me]# cat /etc/fstab

/dev/vdb /data xfs defaults,noatime,nodiratime,nobarrier 0 0

[root@yejr.me]# cat /sys/block/vdb/queue/scheduler
[mq-deadline] kyber none

生成测试数据。

# 下载SSBM工具
[root@yejr.me]# git clone https://github.com/vadimtk/ssb-dbgen.git
[root@yejr.me]# cd ssb-dbgen
[root@yejr.me]# make

# 生成测试数据，机器性能和磁盘有限，所以指定 -s 100
[root@yejr.me]# ./dbgen -s 100 -T c
[root@yejr.me]# ./dbgen -s 100 -T p
[root@yejr.me]# ./dbgen -s 100 -T s
[root@yejr.me]# ./dbgen -s 100 -T l

[root@yejr.me]# wc -l *tbl
  3000000 customer.tbl
  1400000 part.tbl
   200000 supplier.tbl

[root@yejr.me]# ls -l *tbl
-rw-r--r-- 1 root root 331529327 Mar 28 21:17 customer.tbl
-rw-r--r-- 1 root root 140642413 Mar 28 21:17 part.tbl
-rw-r--r-- 1 root root  19462852 Mar 28 21:17 supplier.tbl

创建测试表，根据CH官网提供的建表DDL直接创建即可，参考这里：Star Schema Benchmark（ https://clickhouse.tech/docs/en/getting_started/example_datasets/star_schema/ ）。

导入数据。

这是导入测试数据的耗时以及导完后表空间大小的数据。

表	表数据量	耗时（秒）	tbl文件大小	表空间大小
customer	3,000,000	2.923	317M	116M
part	1,400,000	1.573	135M	25M
supplier	200,000	0.305	19M	7.7M
lineorder	600,037,902	837.288	67G	17G
lineorder_flat	600,037,902	2318.616		54G

只看最大的lineorder表，对tbl文件的压缩比可以达到4:1，如果是相对常规的OLTP数据库，其压缩比显然还要更高。

运行SSBM的几个标准查询耗时

SQL	耗时(秒)	扫描行数(10万)	返回行数
Q1.1	2.123	91.01	1
Q1.2	0.320	7.75	1
Q1.3	0.053	1.81	1
Q2.1	17.979	600.04	280
Q2.2	3.625	600.04	56
Q2.3	3.263	600.04	7
Q3.1	6.906	546.67	150
Q3.2	5.330	546.67	600
Q3.3	3.666	546.67	24
Q3.4	0.058	7.76	4
Q4.1	10.110	600.04	35
Q4.2	1.928	144.42	100
Q4.3	1.373	144.42	800

每次扫描这么多数据量，但这些统计分析为主的SQL查询耗时却并不大，足见CH的计算性能了。

今天先简单介绍到这里，以后有机会再继续分享。

            </div>

ClickHouse性能测试

ClickHouse简介

性能测试

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

ClickHouse性能测试

ClickHouse简介

性能测试

热门文章

最新文章

相关电子书