有个很奇怪的现象,使用OceanBase数据库时候我们数据存储集中在一个节点上,这个要怎么排查呀?之前没有见过这种,集群环境是重建导入数据之后就这样了
【 使用环境 】生产环境
【 OB or 其他组件 】oceanbase
【 使用版本 】 5.7.25 OceanBase_CE 4.1.0.0 (r100000202023040520-0765e69043c31bf86e83b5d618db0530cf31b707)
【问题描述】
数据存储分布不均匀,一个节点173G
(https://ask.oceanbase.com/uploads/default/optimized/2X/a/a25cae8857018cf050f577a67a84020636e317a6_2_775x358.png)
SELECT /+ query_timeout(30000000) / a.TENANT_ID, a.TABLE_NAME, a.TABLE_ID, sum( CASE WHEN b.nested_offset = 0 THEN IFNULL(b.data_block_count+b.index_block_count+b.linked_block_count, 0) 2 1024 * 1024 ELSE IFNULL(b.size, 0) END ) /1024/1024/1024 AS data_size_in_GB FROM CDB_OB_TABLE_LOCATIONS a LEFT JOIN __all_virtual_table_mgr b ON a.svr_ip = b.svr_ip AND a.svr_port=b.svr_port AND a.tenant_id = b.tenant_id AND a.LS_ID = b.LS_ID AND a.TABLET_ID = b.TABLET_ID WHERE a.role = 'LEADER' AND b.table_type >= 10 AND b.size > 0 GROUP BY a.TABLE_ID order by 4 desc
有2种可能
一种可能就是, 你创建集群的时候, 虽然是3台集群, 但你3台集群在一个zone 中, 也就是只有一个副本.
另外一种可能就是, 你创建的是3副本集群, 但你创建租户时, 租户只使用了一个zone.
第一种情况:
建议通过ocp, 先对集群进行缩容, 先下线没有数据的机器, 然后做单机升分布式操作.
黑屏命令非常复杂, 建议通过ocp 进行操作.
对于第二种情况, 类似如下:
alter resource pool sys_pool zone_list=(‘zone1’,‘zone2’,‘zone3’);
alter resource pool pool1 zone_list=(‘zone1’,‘zone2’,‘zone3’);
然后修改locality, 一次改一个,
ALTER TENANT test1 LOCALITY=‘F@zone1,F@zone2’;
ALTER TENANT test1 LOCALITY=‘F@zone1,F@zone2,F@zone3’;
每次改完, 查看
SELECT * FROM oceanbase.DBA_OB_TENANT_JOBS WHERE JOB_TYPE = ‘ALTER_TENANT_LOCALITY’;
看locality 是不是改好了
你是用obd 安装的集群, 还是用ocp 安装的集群?—此回答来自钉群“[社区]技术答疑群OceanBase”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。