案例解读|迁云的灵魂3问,降多少本,增多少效,真平滑否?

本文涉及的产品
对象存储 OSS,20GB 3个月
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
简介: 近年来,在线教育产业发展十分迅速,高速的发展和国家政策规范的落地执行,给在线教育行业客户带来了新的挑战。如何在保障业务高速发展,达到国家等保要求的同时降本增效,成了行业客户研究的主要课题。本篇文章将以H客户全面上云为案例,详解上云带来的核心价值以及上云方案和步骤,希望能给您的业务带来一定帮助。

  近年来,在线教育产业发展十分迅速,在线教育真正打破了时间和空间的限制,使得学员可以随时随地学习,预期2020年将有超过3000亿的市场规模。随着行业不断成熟,国家政策的规范发展使得在线教育的发展进入调整期,烧钱获客的模式不再持续,在兼顾业务发展的同时要注意成本控制。  
  那就需要注意两大问题。一是服务器资源作为IT基础设施支出的头部预算,如何合理利用服务器资源,按需扩容,节省人力维护成本是关键。第二点是由于教育行业的特殊性,满足国家政策对于互联网教育行业安全等级保护有要求,也是重中之重。围绕这两点,阿里云提供了全面的上云解决方案,帮助客户降本增效。
  下面将以沪江教育为案例进行介绍。沪江教育为中小幼、考研留学及职场精英提供多元化的教育产品,包括课程直播、课程点播、互联网在线学习工具等,截止至2018年底已拥有用户接近2亿,是综合性互联网教育平台。

上云如何降本——减少运维消耗是关键

  客户从最开始一台电脑提供服务,到现在已经拥有分布在多个机房的近千台服务器。随着业务的发展,问题也逐渐暴露,当前以自建IDC为主的模式下,资源利用率不高、部署冗余、运维和基础设备开发人力支出成本高,而且可预见的规模扩大,成本会大幅上升。
  帮助客户上云后,优质的IDC和网络资源随时可用,物理环境零人力投入,相对成本线性,实际TCO更低。
_1

图1 自建机房和阿里云TCO对比曲线



上云如何帮助客户增效

  在线教育行业用户大部分都是闲时在线学习,晚上是业务高峰,其他时间资源利用率不高,另外客户的运营推广活动会带来业务高峰考验基础设施支撑能力。在自建IDC的模式下是IT定义业务体量,运营团队与运维团队在推广活动前需规划业务流量,提前准备服务器来应对。
  上云后,按需伸缩、即开即用的计算资源帮助客户快速应对业务高峰带来的挑战,在数分钟内完成原本需数日甚至更长时间的服务配置和部署工作。阿里云利用特有的快速交付和弹性能力,让客户从全量为业务峰值准备计算力,过渡到贴合业务流量曲线准备计算力,从根本上提升资源利用率和部署效率。同时客户还可根据业务场景组合多种计费类型进一步降低成本(图2)。
_2

图2 利用ECS的弹性计费模型进一步降低TCO



如何通过上云简单达到信息安全等级保护要求

  随着面向未成年人的在线教育渗透率逐步上升,国家出台了多项针对在线教育行业的监管政策。教育部和公安部早在2015年就已经联合发布《关于全面推进教育行业信息安全等级保护工作的通知》,今年9月份教育部等八部门印发《关于引导规范教育移动互联网应用有序健康发展的意见》,其中第二章第四条明确要求教育APP提供者需要获得网络安全等级保护定级备案的证明、等级测评报告后进行备案登记。
  政策的变化为客户带来了新的挑战。为通过等保测评,客户在线下机房专门购置了安全硬件设备并投入人力做整改优化。而选择上云,阿里云提供了合规配套整改的安全方案,包括高防、WAF、众测、安骑士、态势感知等安全产品以及云上安全服务,助力客户低成本高效率完成等保备案工作。

上云千般好,如何平滑迁云是关键

  不管从行业发展趋势还是客户业务发展的需求来看,上云会带来很大的价值,而上云对业务可能带来的影响是客户决策时顾虑最多的点。为保证沪江教育CCTALK实时互动教育平台的平滑上云,线上业务不受影响,我们先深入分析了客户云下架构,再根据业务需求设计云上架构以及可行的迁移的方案,逐步执行。
_3

图3 云下架构示意图


  云下架构中,业务应用服务分别部署在两个机房,由专线打通。自建MySQL采用同机房主备两台的方式做灾备,另外实时转码占用接近20%的总物理服务器资源,此外除了机房几百TB的NAS存储外,还有多达几PB的云存储文件。
_4

图4 云上架构示意图


  云上架构中,考虑到客户的Web应用服务已经实现了微服务化Kubernetes部署,云上对Web应用服务选择容器Kubernetes版无缝迁移,同时采用跨可用区的RDS MySQL高可用版本,相比同机房主备模式,提供更高的可用性。存储使用阿里云OSS,除了提供更高的可用性(不低于99.995%)和数据持久性(不低于99.9999999999%)之外,应用服务访问存储的时候可以走内部流量,节省带宽支出。
_5

图5 迁移示意图


  应用服务迁移过程中,使用阿里云 SMC服务器迁移中心服务将在IDC部署的业务应用服务自动、快速、一站式迁移到云上ECS,同时提供工具支持将自建Kubernetes的应用迁移到云上。
  数据库迁移上,使用 数据传输服务DTS迁移数据,数据库无需停机且支持双向同步,上云切换过程支持数据库的回退方案。云原生数据库POLARDB提供传统数据库一键迁移上云的能力,客户无需修改底层代码就可完成数据库的上云。
  存储服务迁移过程中,客户在上云前有海量的文件,而且大部份是小文件,选择使用阿里云提供的离线和在线的迁移工具来支持文件迁移到OSS,利用CDN的闲时流量迁移,基本没有产生额外的迁移带宽费用(CDN95计费)。对于主要是小文件的bucket,结合 OSS的镜像回源功能,直接将数据源切换到阿里云OSS,无需等待迁移任务的数据同步完成。
  从最后实施结果来看,客户的的整个迁移过程很迅速也很平滑,中间多次测试业务流量在云上云下来回切换对用户使用没有任何影响。

小结:上云的价值

1.成本显著优化
所有资源按需使用,上云后贴合业务流量曲线准备计算资源,成本大幅优化。客户后续还可结合RI实例券使用弹性伸缩产品进一步降低成本。
物理环境零人力投入,部署简化,效率提升,基础设施团队精简,人力投入到业务发展中。
2.更高的可用性和安全性
线下同机房部署主备数据库切换成云上跨可用区的RDS高可用版本,可用性更高。客户的云上跨可用区部署的高可用架构可根据需要随时升级为异地灾备部署,获得更高的可用性。
云上使用WAF,DDOS高防IP等专业安全产品,有专业安全团队更新维护,安全性更高。客户使用免费的防DDOS流量即可满足日常安全需要,在被攻击时,可迅速切换为高版本抵御超大流量的攻击行为,在成本和安全诉求之间找到平衡。
3.业务创新
上云后释放了操作系统,虚拟化,资源调度,网络研发等基础技术栈资源,聚焦到业务发展和业务创新。
云上站在达摩院肩上创新,适用于300+场景的阿里云AI产品家族云上即享.沪江教育研发团队结合教育行业场景使用语音识别,机器翻译等AI产品在做业务尝试和创新。



【附录】

1.本案例涉及到的产品

场景 涉及产品
应用服务 ECS、容器ACK
数据库 RDS MySQL高可用版、PolarDB PostgreSQL
存储 OSS
解析类 云解析、PrivateZone
迁移 DTS数据传输服务、OSS在线迁移服务
其它 SLB负载均衡、CDN、媒体处理(转码)

2.在线教育云上业务参考架构

_6

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
目录
相关文章
|
2月前
|
存储 缓存 监控
通用研发提效问题之动态调整干预能力,如何解决
通用研发提效问题之动态调整干预能力,如何解决
|
2月前
|
固态存储 测试技术 数据库
最新测试揭秘:TDengine 线性扩展能力能否满足你的性能需求?
**摘要:** TDengine 的线性扩展能力通过CPU和磁盘测试得以验证。在CPU测试中,使用TDengine V3.3.0.0和taosBenchmark,随着CPU核数从4增至12,写入性能线性提升,每个CPU增加对应约50W条/秒的提升,保持CPU在瓶颈状态。磁盘IO测试中,使用低速机械盘,增加磁盘数量导致写入性能成比例增长,充分利用新增磁盘IO。测试结果表明,无论CPU还是磁盘扩展,TDengine都能有效利用资源,展示出出色的线性扩展能力。
40 0
|
4月前
|
安全 Serverless API
Serverless架构在图像处理中展现出高成本效益,按需付费降低费用,动态调整资源避免浪费
【5月更文挑战第16天】Serverless架构在图像处理中展现出高成本效益,按需付费降低费用,动态调整资源避免浪费。其出色的并发处理能力和自动扩展确保高并发场景的顺利执行。简化开发流程,让开发者专注业务逻辑,同时提供丰富API和集成服务。安全方面,Serverless通过云服务商管理基础架构和多种安全机制保障任务安全。因此,Serverless是处理高并发、动态需求的理想选择,尤其适合图像处理领域。随着技术发展,其应用前景广阔。
51 4
|
4月前
|
存储 Prometheus 监控
成本更低、更可控,云原生可观测新计费模式正式上线
成本更低、更可控,云原生可观测新计费模式正式上线
|
4月前
|
弹性计算 Kubernetes 测试技术
一文掌握弹性与成本的完美平衡 选择正确上云“姿势”,正确实例选型,平滑应对流量高峰
2023云栖大会,阿里云弹性计算弹性计算产品专家王曦、阿里云弹性计算高级技术专家王渊平、阿里云弹性计算高级技术专家田政雄3位嘉宾出席分享,云上付费方式、各规格实例比较应用、ECS如何保障客户满足流量峰值弹性需求等话题。
|
算法 Java 数据挖掘
亿级流量电商系统JVM模型参数预估方案
亿级流量电商系统JVM模型参数预估方案
249 0
亿级流量电商系统JVM模型参数预估方案
|
机器学习/深度学习 存储 弹性计算
冷启动优化:开发者侧降低冷启动影响的方案
冷启动优化:开发者侧降低冷启动影响的方案
14443 0
|
存储 数据采集 算法
|
弹性计算 运维 Kubernetes
边开飞机边换引擎?我们造了个新功能保障业务流量无损迁移
容器化部署应用可以降低企业成本,提升研发效率,解放运维人员。据 Gartner 预计,到 2022 年,将有 75% 的企业将在生产中运行容器化应用程序。Kubernetes 是企业部署容器化应用的首选框架。由于 Kubernetes 部署及运维的复杂性,越来越多的客户选择将业务从 ECS 或者自建的 Kubernetes 迁移到阿里云托管版 Kubernetes —— ACK 中。但是,如何保证业务流量的平滑迁移成为一大挑战。
边开飞机边换引擎?我们造了个新功能保障业务流量无损迁移
|
测试技术 Java
性能测试总结-jmeter经验总结1-混合场景业务比例精准控制
平时测试中经常会遇到需要测试混合场景的压测需求,那么混合场景如何去实现精准控制业务比例呢,网上有许多方法,其中一个比例控制最准确,
2868 0
性能测试总结-jmeter经验总结1-混合场景业务比例精准控制