群消息已读回执(这个diao),究竟是推还是拉?

简介: 群消息的流程如何,接收方如何确保收到群消息,发送方如何收已读回执,究竟是拉取,还是推送,是今天要讨论的问题。

每当发出一条微信消息,都希望对方尽快看到,并尽快回复,但始终不知道对方是否阅读。

每当收到一条不能立马回复的微信消息,都默默返回,假装没看见。

画外音:不想回复的人,唉,你只是个好人。

微信用于个人社交,产品设计上,在线状态,强制已读回执都有可能暴露个人隐私,故微信并无相关功能。

钉钉用于商务交流,其“强制已读回执”功能,让职场人无法再“假装不在线”,“假装没收到”。

有甚者,钉钉的群有“强制已读回执”功能,你在群里发出的消息,能够知道谁读了消息,谁没有读消息。

群消息的流程如何,接收方如何确保收到群消息,发送方如何收已读回执,究竟是拉取,还是推送,是今天要讨论的问题。

一、群消息投递流程,以及可达性保证

大家一起跟着楼主的节奏,一步一步来看群消息怎么设计。

核心问题1:群消息,只存一份?还是,每个成员存一份?

答:存一份,为每个成员设置一个群消息队列,会有大量数据冗余,并不合适。

核心问题2:如果群消息只存一份,怎么知道每个成员读了哪些消息?

答:可以利用群消息的偏序关系,记录每个成员的last_ack_msgid(last_ack_time),这条消息之前的消息已读,这条消息之后的消息未读。该方案意味着,对于群内的每一个用户,只需要记录一个值即可。

解答上述两个核心问题后,很容易得到群消息的核心数据结构。

群消息表:记录群消息。

group_msgs(msgid, gid, sender_uid, time, content);

各字段的含义为:消息ID,群ID,发送方UID,发送时间,发送内容。

群成员表:记录群里的成员,以及每个成员收到的最后一条群消息。

group_users(gid, uid, last_ack_msgid);

各字段的含义为:群ID,群成员UID,群成员最后收到的一条群消息ID。

在核心数据结构设计完之后,一起来看看群消息发送的流程。

业务场景:

(1)一个群中有A, uid1, uid2, uid3四名成员

(2)A, uid1, uid2在线,期望实时收到在线消息

(3)uid3离线,期望未来拉取到离线消息

image.png

其整个消息发送的流程1-4如上图:

(1)A发出群消息

(2)server收到消息后,一来要将群消息落地,二来要查询群里有哪些群成员,以便实施推送

(3)对于群成员,查询在线状态

(4)对于在线的群成员,实施推送

这个流程里,只要第二步消息落地完成,就能保证群消息不会丢失。

核心问题3:如何保证接收方一定收到群消息?

答:各个收到消息后,要修改各群成员的last_ack_msgid,以告诉系统,这一条消息确认收到了。

在线消息,离线消息的last_ack_msgid的修改,又各有不同。

image.png

对于在线的群友,收到群消息后,第一时间会ack,修改last_ack_msgid。

image.png

对于离线的群友,会在下一次登录时,拉取未读的所有群离线消息,并将last_ack_msgid修改为最新的一条消息。

核心问题4:如果ack丢失,群友会不会拉取重复的群消息?

答:会,可以根据msgid在客户端本地做去重,即使系统层面收到了重复的消息,仍然可以保证良好的用户体验。

上述流程,只能确保接收方收到消息,发送方仍然不知道哪些人在线阅读了消息,哪些人离线未阅读消息,并没有实现已读回执,那已读回执会对系统设计产生什么样的影响呢?

二、已读回执流程

对于发送方发送的任何一条群消息,都需要知道,这条消息有多少人已读多少人未读,就需要一个基础表来记录这个关系。

消息回执表:用来记录消息的已读回执。

msg_acks(sender_uid, msgid, recv_uid, gid,if_ack);

各字段的含义为:发送方UID,消息ID,回执方UID,群ID,回执标记。

增加了已读回执逻辑后,群消息的流程会有细微的改变。

image.png

步骤二,server收到消息后,除了要:

  • 将群消息落地
  • 查询群里有哪些群成员,以便实施推送

之外,还需要:

插入每条消息的初始回执状态

image.png

接收方修改last_ack_msgid的流程,会变为:

(1)发送ack请求

(2)修改last_ack_msgid,并且,修改已读回执if_ack状态

(3)查询发送方在线状态

(4)向发送方实时推送已读回执(如果发送方在线)

如果发送方不在线,ta会在下次登录的时候:

(5)从关联表里拉取每条消息的已读回执

这里的初步结论是:

  • 如果发送方在线,会实时被推送已读回执
  • 如果发送方不在线,会在下次在线时拉取已读回执

三、流程优化方案

再次详细的分析下,群消息已读回执的“消息风暴扩散系数”,假设每个群有200个用户,其中20%的用户在线,即40各用户在线。群用户每发送一条群消息,会有:

  • 40个消息,通知给群友
  • 40个ack修改last_ack_msgid,发给服务端
  • 40个已读回执,通知给发送方

可见,其消息风暴扩散系数非常之大。

同时:

  • 需要存储40条ack记录

群数量,群友数量,群消息数量越来越多之后,存储也会成为问题。

是否有优化方案呢?

群消息的推送,能否改为接收方轮询拉取?

答:不能,消息接收,实时性是核心指标。

对于last_ack_msgid的修改,真的需要每个群消息都进行ack么?

答:其实不需要,可以批量ack,累计收到N条群消息(例如10条),再向服务器发送一次last_ack_msgid的修改请求,同时修改这个请求之前所有请求的已读回执,这样就能将40个发送给服务端的ack请求量,降为原来的1/10。

会带来什么副作用?

答:last_ack_msgid的作用是,记录接收方最近新取的一条群消息,如果不实时更新,可能导致,异常退出时,有一些群消息没来得及更新last_ack_msgid,使得下次登陆时,拉取到重复的群消息。但这不是问题,客户端可以根据msgid去重,用户体验不会受影响。

发送方在线时,对于已读回执的发送,真的需要实时推送么?

答:其实不需要,发送方每发一条消息,会收到40个已读回执,采用轮询拉取(例如1分钟一次,一个小时也就60个请求),可以大大降低请求量。

画外音:或者直接放到应用层keepalive请求里,做到0额外请求增加。

会带来什么副作用?

答:已读回执更新不实时,最坏的情况下,1分钟才更新回执。当然,可以根据性能与产品体验来折衷配置这个轮询时间。

如何降低数据量?

答:回执数据不是核心数据

已读的消息,可以进行物理删除,而不是标记删除

超过N长时间的回执,归档或者删除掉

四、总结

对于群消息已读回执,一般来说:

  • 如果发送方在线,会实时被推送已读回执
  • 如果发送方不在线,会在下次在线时拉取已读回执

如果要对进行优化,可以:

  • 接收方累计收到N条群消息再批量ack
  • 发送方轮询拉取已读回执
  • 物理删除已读回执数据,定时删除或归档非核心历史数据

推送还是拉取?

任何脱离业务的架构设计都是耍流氓。

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
目录
相关文章
|
4月前
|
消息中间件 缓存 安全
电商API数据接口深度分析
电商 API 是连接平台、商家与用户的核心枢纽,其设计直接影响数据流通效率与系统稳定性。本文从技术架构、性能优化、安全防护、合规治理等维度深度解析,结合淘宝、京东等头部平台实践,提供高并发场景下的多级缓存、异步处理、智能限流等落地解决方案,助力企业构建高效、安全、合规的 API 体系,推动电商系统智能化演进。
|
6月前
|
JSON 测试技术 数据格式
货拉拉跑腿抢单辅助器,货拉拉抢单开挂神器,运满满抢货神器脚本
本内容涵盖HTTP协议基础、Python的`requests`库使用、Web自动化测试工具Selenium的应用,以及一个订单系统模拟器的实现。
|
5月前
|
JavaScript 前端开发 小程序
Vue 3:现代前端开发的革命性进化
Vue 3:现代前端开发的革命性进化
298 54
|
4月前
|
缓存 边缘计算 网络协议
如何使用CDN加速给网站加速?
阿里云CDN是基于全球3200+节点构建的分布式网络,能有效分担源站压力,加速网站内容分发,提升访问速度。支持全球覆盖,提供高带宽输出能力,适用于各类静态及动态内容加速。
如何使用CDN加速给网站加速?
|
5月前
|
监控 安全 Linux
在Linux中设定账户密码的安全性策略
这些操作应该由有经验的系统管理员进行,因为不当的配置可能导致无法预期的安全问题或者系统访问问题。此外,提升安全性的同时,也需要考虑到用户的便利性,避免设置过于严苛的政策导致用户体验不佳。通常,强密码策略配合两因素认证(2FA)将大大加强账户的安全性。
449 13
|
4月前
|
存储 缓存 监控
利用电商 API 接口,轻松完成多平台价格监控
在电商竞争中,价格策略至关重要。本文介绍如何利用电商平台API,构建自动化价格监控系统,实现多平台实时数据获取与智能调价,提升市场响应速度与销售转化率。
274 0
|
6月前
|
人工智能 供应链 小程序
软件外包众包平台为何没有前途?深度剖析行业顽疾优雅草卓伊凡
软件外包众包平台为何没有前途?深度剖析行业顽疾优雅草卓伊凡
265 2
软件外包众包平台为何没有前途?深度剖析行业顽疾优雅草卓伊凡
|
5月前
|
存储 Java 大数据
Java 大视界 -- Java 大数据在智能家居能源消耗模式分析与节能策略制定中的应用(198)
简介:本文探讨Java大数据技术在智能家居能源消耗分析与节能策略中的应用。通过数据采集、存储与智能分析,构建能耗模型,挖掘用电模式,制定设备调度策略,实现节能目标。结合实际案例,展示Java大数据在智能家居节能中的关键作用。
|
9月前
|
云安全 存储 安全
阿里云安全体检功能深度评测报告
本次体检通过深度扫描发现了4类安全隐患:高危端口暴露、未修复的Log4j2漏洞、OSS存储桶权限错误。针对这些问题,我们采取了具体修复措施,如限制源IP、热更新参数等。体检项目在安全组可视化、漏洞修复指引等方面表现出色,但也存在容器安全检测不足等问题。建议增加一键阻断功能和OpenAPI接口,优化误报反馈机制,并添加合规检测模块。总体而言,阿里云安全体检在风险发现效率上表现优异,建议与云防火墙等产品联动,形成动态防御体系。
|
9月前
|
传感器 人工智能 数据可视化
打造农业大数据平台,助力农业现代化高质量发展!
中安数码积极响应农业农村部《全国智慧农业行动计划(2024—2028年)》,推出智慧农业大数据平台解决方案。该方案涵盖驾驶舱、农业用地“一张图”、土壤环境监测、土地质量评价、作物生长状态监测评估及农业生产管理等功能模块,通过大数据、AI、GIS等技术实现农业智能化、精准化发展,助力提升农业生产效率与资源利用率,推动现代农业高质量发展。