文档备案控制台

开发者社区问答正文

OTS表格存储产品，如果自增id作为分区键，建议自增id前拼接一个哈希前缀。请问什么原理？哈希算法如何选择？

我的产品里到处是自增ID作为主键，同时也需要作为分区键，OTS产品的最佳实践的帮助里建议：自增id作为分区键拼接一个哈希前缀比较好，会将最近新写入的记录均匀分到各个分区里，单并没有说明原理，让人很费解。产生两个问题：

分区键哈希的原理简单介绍一下？一直认为自增已经是每个键不一样了，且取模会很均匀了，为啥直接用会不均匀分配，
哈希前缀具体应该如何哈希，那些哈希算法推荐？

展开

收起

包三哥 2016-06-20 21:19:05 7302 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

木洛

表格存储（TableStore）技术负责人，专注结构化数据存储领域技术和解决方案。

可以使用自增ID，但是前提是每个ID上的访问需要均匀。如果你的表的访问热度都集中在最新创建的ID的话，那就很容易产生热点了。
哈希算法的话，可以用md5，也可以直接用java的hashcode函数自带的实现。

关于自增ID，有个典型的例子是时间序列数据，可以参考下这篇文章： https://yq.aliyun.com/articles/54644

2019-07-17 19:44:29

赞同展开评论

问答分类：

存储算法表格存储

问答标签：

原理算法哈希算法 id算法原理哈希算法拼接算法

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

OpenSearch行业算法版和高性能检索版索引重建同步数据原理

235

1

0

表格存储如何按照分区导出文件

167

1

0

请问下使用表格存储OTS出现这个问题，应该怎么处理？当前代码是使用并发方式进行存储的。

352

2

0

表格存储如何根据本次 OTS 操作的 requestId 查询操作日志啊？

359

2

0

请简要说明加法贡献算法的基本原理。

170

1

0

关于阿里云表格存储（OTS）的几个关键知识点是什么？

312

2

0

在表格存储中官网的spark这样读取OTS能否设置连接OTS的超时参数？

205

1

0

在表格存储中spark dataframe读写OTS的话使用如下会报错，如何解决?

224

0

0

在表格存储中ots支持odps spark进行读写吗？

175

1

0

在表格存储中OTS实例绑定VPC，没有API可以操作吗？控制台应该也是调的API吧？

200

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

阿里云服务器多少钱一年？支持40个连接的配置

阿里云服务器多少钱一年企业用？公司用什么配置？

阿里云服务器多少钱一年？企业用的配置费用价格

阿里云服务器多少钱一年？学生用的配置价格

相关文章

Claude Code四大定制机制全解：CLAUDE.md、Hooks、Skills、Subagents实操指南

阿里云国际站代理：香港服务器和大陆服务器究竟有什么区别？

基于YOLO11的光伏电池板缺陷检测：从数据集构建到云上训练实践

基于YOLO11的光伏电池板缺陷检测：从数据集构建到云上训练实践

4D Gaussian Splatting 是怎么工作的：从规范 Gaussian 到形变场的原理拆解

还有其他疑问?