【数据库评测】[续]Cloudwave 4.0 集群版(4节点) VS Starrocks 3.0 集群版(4节点)-阿里云开发者社区

【数据库评测】[续]Cloudwave 4.0 集群版(4节点) VS Starrocks 3.0 集群版(4节点)

2023-07-25 141

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【数据库评测】[续]Cloudwave 4.0 集群版(4节点) VS Starrocks 3.0 集群版(4节点)

一、写在前头

，评测的过程中，意外发现starrocks3.0版本在我预先设置hdfs副本数=2的配置下，自行把starrocks自己的hdfs副本数改成3。为了保持环境的一致性，七镜还是决定测一测Cloudwave4.0在hdfs副本数=3的配置下，是什么表现。

硬件环境：4台 64核256g 云服务器（组成4节点的集群），essd pl1 高效云盘
软件环境：jdk19（Cloudwave4.0官方推荐版本，官方基于jdk19版本里头的的vector api，实现全面向量化引擎）、jdk8（starrocks安装推荐jdk版本，主要用于fe，亦可少踩坑）、mysql8（作为starrocks的客户端）、hadoop 3.2.2（作为cloudwave 和 starrocks 共同的分布式存储，副本数=3）
软件版本：Cloudwave 4.0（最新版在2023年5月份发版），Starrocks 3.0（最新版在2023年4月份发版）
评测数据集：ssb1000

执行19轮测试脚本，每轮执行13条标准测试sql，去除第1轮的测试数据(由于IO原因，第1次查询两边的性能均受IO影响，本测试主要测数据库引擎的算法在同等计算资源的条件下的优劣，因此去除第一轮测试数据)，将余下的18轮测试数据做平均，获得每条sql的平均耗时;
观察最大CPU占用
观察存储压缩比
观察数据加载时间

测试方法：执行19轮SQL测试脚本，每轮执行1条多表联合join拓展测试sql，去除第1轮的测试数据(由于IO原因，第1次查询两边的性能均受IO影响，本测试主要测数据库引擎的算法在同等计算资源的条件下的优劣，因此去除第一轮测试数据)，将余下的18轮测试数据做平均，获得sql的平均耗时
观察最大CPU占用
统计耗时
多表联合join拓展测试SQL1:select count(*) from lineorder,customer where lo_custkey = c_custkey;
多表联合join拓展测试SQL2:select count(*) from lineorder,customer,supplier where lo_custkey = c_custkey and lo_suppkey = s_suppkey;

结合Starrocks3.0的测试数据，汇总出下表

Cloudwave4.0集群版在4台64核256g内存的云服务器上，hdfs副本数=3的环境下，测ssb1000国际标准测试集，优于Starrocks3.0集群版近0.4倍

[附]13条标准测试SQL测试结果表：

翰云云原生数据仓库（Cloudwave4.0）未来可期，七镜后续还将带来翰云云原生数仓在S3对象存储上的性能表现、更大的数据集上的表现、不同的数据集上的表现、以及在云的加持下，Cloudwave4.0的云原生架构是如何发挥其自身优势的，敬请期待。