不同于 LRU 等传统的缓存替换置换策略,预测归档数据的时间窗口更长,也需要考虑哪些特征?
• 访问频次,以一定时间窗口进行聚合,这部分特征反映了数据访问热度的变化。
• SQL 日志的语义信息,以电商交易业务为例,订单表的访问模式直接反映了用户的购物行为。对于虚拟订单的充值,一条记录在创建后可能就不会再被访问了,对于实物交易的订单,由于涉及物流配送、签收,甚至还会涉及退货等售后环节,数据的生命周期呈现出非常复杂的分布,再加上双十一、双十二等大促活动时对于发货、收货等规则的调整,同一个负载的数据生命周期分布也会出现变化,通过简单的规则很难识别出哪些数据是冷数据,但是通过对SQL 访问的字段进行编码作为特征,对于同一个业务而言,更新、读取某些字段和记录生命周期的不同阶段关系密切,可以较为精准地刻画一条记录的生命周期。
• 时间戳相关的特征,类似于插入时间,最后一次更新的时间,也对数据的生命周期有指导意义。
以上内容摘自《云原生数据库原理与实践》,这本书可以在电子工业出版社天猫店购买。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。