从钉钉为什么没有崩说起

简介: 这几天,因为流量过大,一些热门的视频网站纷纷崩了。为什么钉钉没有崩?阿里云官微也回应了:汇报一下这几天的主要工作,帮钉钉和大家扩容扩容扩容扩容扩容扩容扩容扩容扩容扩容扩容 获悉,自春节以来,在家办公及在家上课的强需求,钉钉相关系统峰值流量暴增几百倍,超过1千万家企业组织的2亿上班族在线开工,近5千万学生通过钉钉在线课堂的方式学习。

这几天,因为流量过大,一些热门的视频网站纷纷崩了。为什么钉钉没有崩?阿里云官微也回应了:汇报一下这几天的主要工作,帮钉钉和大家扩容扩容扩容扩容扩容扩容扩容扩容扩容扩容扩容
_1

获悉,自春节以来,在家办公及在家上课的强需求,钉钉相关系统峰值流量暴增几百倍,超过1千万家企业组织的2亿上班族在线开工,近5千万学生通过钉钉在线课堂的方式学习。在阿里云上的钉钉从容扩容了几万台云服务器ECS,使钉钉成为使用最频繁最流畅的平台。其实,除了扩容本身,更需要企业IT管理人员考虑的是,如何应对这样的突发流量?如何构建高可用的业务系统?如何保证业务系统的安全?。。。我相信这些都是对企业IT管理人员的灵魂之问。小编作为曾经的IT管理员,现在的云产品经理,也在这里念叨几句。。。。。。

首先,要基于公有云构建业务系统,我想这点现在大家都有共识了。面对突发流量,公有云的弹性能力自然是最好的应对方式。对于第一天就在云上或者完全上云了的客户,这点不在话下,关键是要选择有充足资源的云服务商。对于在云下数据中心还部署了业务系统的,至少也要采用混合云的方式,先和公有云打通,一旦面对这样的情形,才能立即利用公有云的弹性能力。一般来说,公有云服务商都提供多种方式构建混合云,比如常用的专线和VPN,阿里云还提供智能接入网关这样的SDWAN方式上云。针对大流量场景,建议使用高速通道(专线)方式构建混合云,在突发流量来临的时候才能从容面对。

_2

其次,建议采用多地域部署业务系统。一方面当然是容灾,提升可靠性,其次,也能更充分的利用公有云更大的弹性资源池。有了公有云之后,多地域部署业务系统的成本和复杂性都大大降低了。在多个地域开通VPC,部署业务系统,并通过云企业网这样的产品打通多地域VPC,一旦流量增加,可以随时弹性增加云企业网的多地域互联带宽。可以说瞬间构建企业自己的核心网络并且随时弹性扩容,这在使用公有云之前,简直不敢想象。。。。。。对于多VPC打通后又需要进行访问控制的,也可以使用云企业网CEN的路由策略功能来实现。业务系统部署的内网通信问题解决了,还需要考虑的是大流量的处理和调度,这方面,负载均衡这样的产品自然是首选。

_3

采用多地域部署业务系统的复杂性主要在于数据同步或者数据一致性问题,这方面可以参考阿里大牛毕玄的相关文章,网上很多,搜索一下即可,比如 从冷备到多活,阿里毕玄谈数据中心的异地容灾 。考虑到异地多活的技术复杂性,小编个人其实建议IT管理人员结合自身的实际情况考虑,可能对大部分企业来说,对前端系统先实施多地域部署是更可行的方式,而前端系统往往是大流量的瓶颈。另外,还需要补充一点,除了多地域部署,在同地域也尽可能采用多可用区部署,也是容灾提升可靠性和扩大资源池的考虑。多可用区部署对复杂性增加不多,阿里云的VPC本身就是跨可用区具备跨可用区容灾能力的,负载均衡产品也支持在多可用区调度流量。可能需要多关注的是,虽然阿里云同地域不同可用区之间的延迟是非常低的,但如果前端系统和后端系统部署在不同可用区,并且多次跨可用区,还是会增加一定的延迟,绝大多数情况来说,这样的延迟增加是不会有问题的,但对于延迟极其敏感的业务还是要考虑这点,尽量避免多次跨可用区调用。对于大规模业务系统来说,VPC对于大规模业务系统来说,VPC容量还是一个需要考虑的点,可能一个VPC里需要能容纳几十万个实例,包括如云服务器ECS,弹性网卡,容器等等。

再次,从系统架构的角度来说,还需要考虑。。。。。

扯远了,怎么说到系统架构问题就没完没了了,看来小编的IT管理员的职业病又犯了,收不住。。。回到类似钉钉这样的办公应用来说,用户分布在世界各地,各地用户的网络状况也不一样,如何提升这些用户的访问质量就非常关键。尤其是对于需要视频互动这样的场景,更需要高可靠的网络质量。这个问题可以分成两个方面来考虑。一方面是选择公有云高质量公网带宽,也就是我们IT管理员都知道的BGP带宽。一般来说,公有云服务商都会宣传自己的BGP带宽具备N多线运营商接入,价格又便宜,支持95计费,弹性又好,简直不要太好了。但小编认为,有多少线运营商接入,质量多好,是需要全国人民访问之后觉得好才是真的好。

_5

试想一下,如果一个服务商本身的业务对网络质量都不敏感,本身都不具备高质量的BGP带宽,哪又怎么能对用户提供高质量的带宽呢?另外一点,必须考虑云服务商能不能提供大峰值的保障,说的再好,没有保障都是刷流氓。

据小编打听,这次钉钉扩容准备了超4Tbps 高质量BGP带宽,这些BGP带宽和淘宝,天猫是一样的。另外,还使用了共享带宽进行管理,共享带宽是大用户的带宽管理利器,一方面可以非常方便的管理海量的公网IP地址,另一方面,提供超大的峰值带宽保障。

又有点跑远了,刚说到对办公应用来说,一方面要选择靠谱云服务商的靠谱BGP带宽和产品,接下来要说的是,利用端进行加速或者选择一些加速产品也很关键。一般来说,有实力的公有云服务商有很大的资源优势,在全球都有Region布局,在世界各地提供服务,并通过网络将这些地域连接起来,构成一张覆盖全球的核心网络。在这个全球网络的基础上,利用自己的研发技术优势构建一些加速产品。企业办公服务商业可以较好的利用这样的产品,提供用户的访问质量。

_6

小编打听到,阿里云全球加速产品最近要发布新版本,据说有很多高科技,具体就先不剧透了,敬请期待吧。

最后,对于IT管理人员来说,远程运维和移动办公是一个刚需,小编这里也安利一下,带个货,阿里云智能接入网关(Smart Access Gateway)软件版,即SAP-APP是IT管理员可以考虑的解决方案。

智能接入网关APP支持终端(PC、手机)直接拨号内网加密安全上云,企业员工通过APP可以轻松实现安全的移动办公、远程运维。
了解更多

_7

近期,SAG-APP正在搞免费试用活动,2020.2.15-2020.3.30期间申请,前100个通过审核的的企业,可获得1个月免费试用。试用期间,我们将提供每个用户20个客户端账号,每个账号5GB/月流量套餐。为了保障给您的企业提供优质的网络服务,我们将按报名顺序优先提供支持。立即报名

小编打听到,SAG-APP近期将支持全平台(Windows/Android/IOS/MAC),并且将陆续上线很多高级功能。

目录
相关文章
|
Java Maven
java修改当前项目的maven仓库地址为国内
修改当前项目的maven仓库地址为国内
|
11月前
|
人工智能 网络性能优化 异构计算
阿里云基础网络技术5篇论文入选全球网络顶会NSDI
阿里云在NSDI 2025会议上发表5篇主会论文,涵盖大模型训练网络故障诊断、仿真、性能优化及CDN流控算法等领域。其中,《Evolution of Aegis》提出两阶段演进路线,显著降低故障诊断时间;《SimAI》实现高精度大模型训练模拟;其他论文分别在CDN拥塞控制、GPU解耦推理和容器网络性能优化上取得突破。这些成果为AI大模型时代的云计算基础设施发展提供了重要支持。NSDI是计算机网络与系统研究领域的顶级会议,本次录取率仅12.5%。
|
7月前
|
传感器 运维 监控
中小微企业能源管理 “入门神器”:MyEMS 开源系统如何低成本实现专业级管控?
MyEMS开源能源管理系统,助力中小微企业轻松破解能耗难题。无需高昂投入与复杂运维,灵活对接现有设备,实现能耗实时监控、智能分析与异常预警。功能实用、部署简单,让节能降耗真正落地,轻松迈入高效能源管理时代。(237字)
188 0
|
11月前
|
人工智能 运维 网络安全
重构门店网络:从“打补丁“到“造地基“的跨越
传统网络架构正在威胁门店数字化转型,其“三大致命矛盾”架构老化、业务爆发、新兴技术卡壳等问题日益严重。传统网络的“人肉运维”模式效率低下,人肉容灾能力不足。随着云化需求的增加,传统网络架构无法适配云计算、AI应用等新兴技术,云化受阻。
|
弹性计算 人工智能 安全
企业级DeepSeek调用指南:通过私网连接(PrivateLink)实现DeepSeek R1模型的稳定接入
DeepSeek R1是一款开源免费的高性能生成式AI模型,其发布引发全球技术社区广泛关注。在多项基准测试中,DeepSeek R1展现出与GPT-3比肩的核心性能指标,吸引了众多开发者和企业用户进行技术验证与场景适配。阿里云百炼平台已提供DeepSeek模型的公网调用支持,但考虑到数据安全与合规性挑战,建议通过私网连接(PrivateLink)建立安全调用通道,确保端到端的数据传输安全,并满足金融、医疗等强监管行业的合规要求。私网连接方案具备构建私有网络环境、实现毫秒级延迟服务调用、满足行业监管合规要求等优势,为企业提供数据安全与业务发展的双重保障。
企业级DeepSeek调用指南:通过私网连接(PrivateLink)实现DeepSeek R1模型的稳定接入
|
安全 自动驾驶 物联网
新四化驱动,如何构建智能汽车的“全场景”可进化互联网络?
在智能化、电动化、网联化、共享化的时代浪潮中,汽车正从单纯的 “机械产品” 进化为先进的 “移动智能终端”。在软件定义汽车(SDV)的崭新时代,每一次 OTA 升级的顺利完成、每一秒自动驾驶的精准决策、每一帧车载娱乐交互的流畅呈现,都离不开一张实时响应、全域覆盖、安全可靠的广域网络。
|
Java 调度
线程池初探
线程池初探
|
人工智能 缓存 异构计算
云原生AI加速生成式人工智能应用的部署构建
本文探讨了云原生技术背景下,尤其是Kubernetes和容器技术的发展,对模型推理服务带来的挑战与优化策略。文中详细介绍了Knative的弹性扩展机制,包括HPA和CronHPA,以及针对传统弹性扩展“滞后”问题提出的AHPA(高级弹性预测)。此外,文章重点介绍了Fluid项目,它通过分布式缓存优化了模型加载的I/O操作,显著缩短了推理服务的冷启动时间,特别是在处理大规模并发请求时表现出色。通过实际案例,展示了Fluid在vLLM和Qwen模型推理中的应用效果,证明了其在提高模型推理效率和响应速度方面的优势。
云原生AI加速生成式人工智能应用的部署构建
|
机器学习/深度学习 人工智能 自然语言处理
人工智能在客服领域有哪些应用?
人工智能正在彻底改变着传统客服行业,它不仅拓展了业务边界,还推动着整个行业向更高效、更人性化方向迈进。
1044 7
|
运维 安全 Cloud Native
"揭秘!Trivy——云原生时代的隐形安全侠,一键扫描,让容器镜像漏洞无所遁形,守护你的云端帝国坚不可摧!"
【8月更文挑战第14天】在云原生时代,容器技术如Docker与Kubernetes大放异彩,加速了应用部署。但容器化的普及也带来了安全挑战,尤其是镜像的安全性至关重要。Trivy,一款高效且轻量级的镜像安全扫描工具应运而生,成为开发者与运维人员的得力助手。它由Aqua Security开发,支持一键式全面扫描,能快速检测镜像中的漏洞与配置风险,并提供修复建议。Trivy采用Go语言编写,轻巧高效,支持多平台,并可轻松集成到CI/CD流程中,确保只有安全的镜像才能部署到生产环境。无论新手还是专家,Trivy都是构建安全可靠云环境的理想选择。
388 2