每秒30W次的点赞业务,怎么优化?

简介: 30WQPS的点赞计数业务,如何设计?

image.png

继续答星球水友提问,30WQPS的点赞计数业务,如何设计? 可以看到,这个业务的特点是:(1)吞吐量超高(2)能够接受一定数据不一致画外音:计数有微小不准确,不是大问题。 先用最朴素的思想,只考虑点赞计数,可以怎么做?有几点是最容易想到的:(1)肯定不能数据库抗实时读写流量;(2)redis天然支持固化,可以用高可用redis集群来做固化存储(3)也可以用MySQL来做固化存储redis做缓存,读写操作都落缓存,异步线程定期刷DB(4)架一层计数服务,将计数与业务逻辑解耦; 此时MySQL核心数据结构是:

t_count(msg_id, praise_count)

  此时redis的KV设计也不难:

key:msg_id

value:praise_count
image.png

似乎很容易就搞定了:(1)服务可以水平扩展;(2)数据量增加时,数据库可以水平扩展;(3)读写量增加时,缓存也可以水平扩展; 计数系统的难点,还在于业务扩展性问题,以及效率问题。 以微博为例:
image.png

(1)用户微博首页,有多条消息list<msg_id>,这是一种扩展(2)同一条消息msg_id,不止有点赞计数,还有阅读计数,转发计数,评论计数,这也是一种扩展 假如用最朴素的方式实现,多条消息多个计数的获取伪代码如下:

// (1)获取首页所有消息msg_id

list<msg_id> = getHomePageMsg(uid);

// (2)对于首页的所有消息要拉取多个计数

for( msg_id in list<msg_id>){

         //(3.1)获取阅读计数

         getReadCount(msg_id); 

         //(3.2)获取转发计数

         getForwordCount(msg_id);

         //(3.3)获取评论计数

         getCommentCount(msg_id);

         //(3.4)获取赞计数

         getPraiseCount(msg_id);

}

  由于同一个msg_id多了几种业务计数, redis的key需要带上业务flag ,升级为:

msg_id:read

msg_id:forword

msg_id:comment

msg_id:praise

用来区分共一个msg_id的四种不同业务计数,redis不能支持key的模糊操作,必须访问四次reids。   假设首页有100条消息,这个方案总结为: (1)for循环每一条消息,100条消息100次; (2)每条消息4次RPC获取计数接口调用; (3)每次调用服务要访问reids,拼装key获取count; 画外音:这种方案的扩展性和效率是非常低的。   那如何进行优化呢?   首先看下数据库层面元数据扩展,常见的扩展方式是, 增加列 ,记录更多的业务计数。
image.png

如上图所示,由一列点赞计数,扩充为四列阅读、转发、评论、点赞计数。

  增加列这种业务计数扩展方式的缺点是: 每次要扩充业务计数时,总是需要修改表结构 ,增加列,很烦。   有没有不需要变更表结构的扩展方式呢? 行扩展 是一种扩展性更好的方式。
image.png

表结构固化为:

t_count(msg_id, count_key, count_value)

当要扩充业务计数时,增加一行就行,不需要修改表结构。 画外音:很多配置业务,会使用这种方案,方便增加配置。   增加行这种业务计数扩展方式的缺点是: 表数据行数会增加 ,但这不是主要矛盾,数据库水平扩展能很轻松解决数据量大的问题。   接下来看下redis批量获取计数的优化方案。
image.png

原始方案,通过拼装key来区分同一个msg_id的不同业务计数。

  可以升级为,同一个value来存储多个计数。
image.png

如上图所示,

同一个msg_id的四个计数 ,存储在一个value里,从而避免多次redis访问。
画外音:通过value来扩展,是不是很巧妙?   总结 计数业务,在数据量大,并发量大的时候,要考虑的一些技术点: (1)用缓存抗读写; (2)服务化,计数系统与业务系统解耦; (3)水平切分扩展吞吐量、数据量、读写量; (4)要考虑扩展性,数据库层面常见的优化有:列扩展,行扩展两种方式; (5)要考虑批量操作,缓存层面常见的优化有:一个value存储多个业务计数;   计数系统优化先聊到这里,希望大家有收获。

欢迎大家继续提问,有问必答。

本文转自“架构师之路”公众号,58沈剑提供。

目录
相关文章
|
前端开发 算法 安全
Flask编写API及调用
Flask编写API及调用
451 1
|
Kubernetes Linux Shell
k8s教程(pod篇)-定时任务
k8s教程(pod篇)-定时任务
1132 1
|
JavaScript 前端开发
VUE element-ui之table表格自增序号(前端实现)
VUE element-ui之table表格自增序号(前端实现)
2207 0
|
9月前
|
关系型数据库 OLAP 数据库
免费试用|Vibe Coding正当时,AnalyticDB Supabase极速开发爆款应用
云原生数据仓库AnalyticDB PostgreSQL版重磅推出Supabase托管版本
|
NoSQL Java 关系型数据库
这个评论系统设计碉堡了
先赞后看,南哥助你Java进阶一大半官网给出了Facebook评论系统的高级设计图,Facebook的评论竟然是支持实时刷新的。也就是说用户不用刷新帖子,只要帖子有新的评论就会自动推送到用户端,这里Facebook使用的便是每天在全球有设备在使用的WebSocket技术。我是南哥,一个Java学习与进阶的领路人。相信对你通关面试、拿下Offer进入心心念念的公司有所帮助。
809 5
这个评论系统设计碉堡了
一文搞懂Go读写Excel文件
一文搞懂Go读写Excel文件
|
SQL 存储 Oracle
SQL优化2020最全干货总结---MySQL
BATJTMD等大厂的面试难度越来越高,但无论从大厂还是到小公司,一直未变的一个重点就是对SQL优化经验的考察。一提到数据库,先“说一说你对SQL优化的见解吧?”。
31244 2
|
缓存 运维 负载均衡
分布式系统架构设计与挑战
【6月更文挑战第29天】分布式系统架构设计涉及组件化、通信、数据一致性、负载均衡和容错处理,旨在实现高可用性和可扩展性。然而,数据一致性、性能、可伸缩性和容错是主要挑战。解决方案包括使用一致性算法、性能优化、设计可伸缩架构和实施容错机制。随着技术进步,这类系统将继续在云、大数据和物联网中扮演关键角色。
|
存储 缓存 前端开发
git常用命令和参数有哪些?【git看这一篇就够了】
git常用命令和参数有哪些?【git看这一篇就够了】
486 1
|
Java 应用服务中间件 API
高性能分布式API网关Kong1
高性能分布式API网关Kong1
2036 3