云MSP服务案例丨高压高并发环境下的数据库运维解决方案

简介: 近年来,随着电商产业的不断发展,越来越多的传统企业加入电商战场,根据《中国电子商务行业市场前瞻与投资战略规划分析报告》,预测2019年全国电子商务交易规模将达37.75万亿元。未来五年(2019-2023)年均复合增长率约为11.52%,并预测在2023年全国电子商务交易规模将达到58.38万亿元。

近年来,随着电商产业的不断发展,越来越多的传统企业加入电商战场,根据《中国电子商务行业市场前瞻与投资战略规划分析报告》,预测2019年全国电子商务交易规模将达37.75万亿元。未来五年(2019-2023)年均复合增长率约为11.52%,并预测在2023年全国电子商务交易规模将达到58.38万亿元。

IMG_2193

每个节假日都成为各大电商平台、社群网站、分享社区进行引流、大促、活动的战场,保障每一次高压高并发环境下业务能够稳定运行,是这类电商网站和信息流网站的强需求。

01、客户背景

某款查询化妆品成分的手机APP企业,主打“化妆品成分表查询”帮助更多消费者理智挑选适合自己的护肤品。作为一个工具型APP,该公司更加关注于产品成分的安全性,所以在“3.15”消费者权益日准备了一系列的化妆品安全活动,让更多消费者理性看待化妆品,通过科学的化妆品成分分析,合理规避风险。

因该APP目前在App Store健康排行榜第一位,流量较大,为了更好的完成此次活动,该APP希望有专注于企业大促运维的团队协助完成整个高压高并发环境下的活动维稳护航。

云掣科技是一家专注于企业云托管(MSP)服务的公司,现拥有多年淘宝双十一大促维稳实践,服务了方太厨卫、阿吉豆、老板电器等电商企业。本次将会在活动期间保障该客户业务的稳定运行,使得CPU占比较之前下降64%。

02、项目方案

在315活动前,该企业的数据库实例突然出现一次夯机,影响业务正常运行,在排查了故障后,客户预想到“3.15”流量上涨可能会再次出现业务无法访问的情况,遂寻求云掣科技数据库团队的协助。

_

大促护航专项服务方案图

云掣数据库团队根据该企业的现状进行大促护航专项服务方案制定,预设活动环境下数据量情况,对性能进行评估检测。

由于时间紧急,业务方没有时间来做压测,当前数据库可承受最大压力上限无法得知。所以数据库团队使用日志信息寻找数据库中出现的慢SQL,通过日志数据分析与开发同学进行沟通优化,完成了整个活动前期的准备。

03、客户收益

云掣科技数据库团队帮助该企业完成了以下目标:

1、评估当前数据库资源使用情况以及活动预计流量后,建议业务方对实例进行升配

2、现场支持期间对数据库存在的慢SQL进行优化

3_11_3_12cpu
优化前

3_14_3_15cpu
优化后

活动优化前后CPU占比图,较优化前下降了64%

_3
图为活动前cpu状态
活动前该企业的CPU被打满,严重影响业务使用。云掣科技数据库团队帮助该企业进行了深度的检索分析,从数据库入手,发现数据库查询队列与活跃会话堆积严重。针对数据库情况进行紧急排查故障原因,故障处理,并且针对此次情况对MongoDB、MySQL、Redis进行升配,并对数据库中存在的慢SQL进行优化。
在整个活动期间,数据库整体运行正常,各负载均处于低水位,未因运维原因导致服务中断。

后记:

云掣数据库团队会继续为用户提供云上数据库的运维服务,帮助客户从繁杂的数据库运维中解脱出来,专注于企业核心业务发展。

数据库是企业的核心,企业的身家性命都存在一个个的数据库中,云掣科技希望可以通过数据库的能力,帮助更多企业在云时代管理好数据库,让业务稳定运行。

目录
相关文章
|
3天前
|
关系型数据库 MySQL 数据库
数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
|
13天前
|
运维 监控 安全
云计算环境下的运维挑战与解决方案
本文探讨了云计算环境中运维面临的主要挑战,包括资源管理、自动化部署、安全性问题等,并提出了相应的解决策略。通过案例分析和最佳实践,为云环境下的运维工作提供了指导和参考。
25 1
|
13天前
|
SQL 数据库
GBase8a 数据库集群v953扩容案例问题分享
GBase8a 数据库集群v953扩容案例问题分享
|
13天前
|
SQL 数据库
gbase 8a 数据库 SQL优化案例-关联顺序优化
gbase 8a 数据库 SQL优化案例-关联顺序优化
|
20天前
|
运维 监控 持续交付
云计算环境下的运维自动化实践
本文探讨了在云计算环境下实施运维自动化的必要性、挑战及解决方案,重点介绍了如何利用现代技术工具实现高效的云资源管理和监控。通过具体案例分析,展示了自动化运维在提升系统稳定性、降低人力成本方面的优势。
|
14天前
|
存储 SQL 数据库
Sybase数据恢复—Sybase数据库常见问题之数据库无法启动的恢复案例
Sybase数据库数据恢复环境: Sybase数据库版本:SQL Anywhere 8.0。 Sybase数据库故障&分析: Sybase数据库无法启动。 使用Sybase Central连接报错。 数据库数据恢复工程师经过检测,发现Sybase数据库出现故障的原因是:异常断电造成Sybase数据库无法回写正常数据,导致多个存储页数据不一致,系统表描述和存储表不一致,部分存储页底层数据完全杂乱。
|
15天前
|
Oracle 关系型数据库 数据库
Oracle数据恢复—Oracle数据库文件有坏快损坏的数据恢复案例
一台Oracle数据库打开报错,报错信息: “system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。管理员联系我们数据恢复中心寻求帮助,并提供了Oracle_Home目录的所有文件。用户方要求恢复zxfg用户下的数据。 由于数据库没有备份,无法通过备份去恢复数据库。
|
21天前
|
存储 Oracle 关系型数据库
oracle数据恢复—Oracle数据库文件大小变为0kb的数据恢复案例
存储掉盘超过上限,lun无法识别。管理员重组存储的位图信息并导出lun,发现linux操作系统上部署的oracle数据库中有上百个数据文件的大小变为0kb。数据库的大小缩水了80%以上。 取出&并分析oracle数据库的控制文件。重组存储位图信息,重新导出控制文件中记录的数据文件,发现这些文件的大小依然为0kb。
|
25天前
|
存储 运维 安全
Spring运维之boot项目多环境(yaml 多文件 proerties)及分组管理与开发控制
通过以上措施,可以保证Spring Boot项目的配置管理在专业水准上,并且易于维护和管理,符合搜索引擎收录标准。
39 2
|
1月前
|
消息中间件 资源调度 关系型数据库
如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理
本文介绍了如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理。主要内容包括安装Debezium、配置Kafka Connect、创建Flink任务以及启动任务的具体步骤,为构建实时数据管道提供了详细指导。
60 9

热门文章

最新文章