开发者社区> 问答> 正文

云计算之路-阿里云上:5月1日下午飘过的一朵乌云

云计算之路更多分享的是我们遇到的实际问题,我们觉得实际问题更具分享价值,更能让人从中受到启发、学到东西。而且通过如何面对问题、解决问题可以更深入地了解我们所在的“云”未来是否可以长期定居。

4月26日“ 乌云变成蓝天”的希望成为了现实。当有人怀疑乌云是应用程序引起的时候,我们未改一行代码就解决了问题。当有人谴责我们总是怀疑云平台的问题时,实际我们在怀疑之前已经对应用程序进行了排查。

对于云平台的问题,我们喜欢小题大作,因为它影响的不是我们一家网站,而是云上成千上万的网站,而这些网站服务着成万上亿的用户。



5月1日下午17:22~17:32,蓝天之下,飘过了一朵乌云。感谢两位园友看到了乌云并向我们反馈!我们通过多个监测数据确认了这朵乌云。

1. 监控宝


2. 阿里云云监控


3. Windows性能监视器


通过监测数据,可以知道当时无法连接负载均衡(SLB)的80端口(监控宝与阿里云云监控),SLB中的云服务器未收到来自SLB的请求(Windows性能监视器),使用这台SLB的博客站点当然就无法访问。

确认了故障后,我们向阿里云提交了工单,得到的反馈是那段时间这台SLB发生了瞬时大流量导致Proxy offline(简单来说SLB相当于一个反向代理,所有请求先到SLB,再由SLB转发给云服务器),SLB与云服务器之间无流量。具体是什么原因导致了瞬时大流量,阿里云技术人员还在进一步排查。

希望阿里云早日排查出问题的真正原因,SLB的任何问题都不容小觑,因为SLB的故障是单点故障。

博文原文: http://www.cnblogs.com/cmt/archive/2013/05/02/3055085.html

展开
收起
cnblogs 2013-05-02 18:52:50 10256 0
12 条回答
写回答
取消 提交回答
  • PHP程序员,业余无线电爱好者,呼号:BH9BHT,自由职业!
    只有像你这种大型站点才能不断促进阿里云核心技术的提高和完善!支持
    2013-05-04 23:02:54
    赞同 展开评论 打赏
  • 我已经用上了slb,两台标准A
    2013-05-04 22:54:44
    赞同 展开评论 打赏
  • SLB至今还没学会设置。
    2013-05-04 19:11:03
    赞同 展开评论 打赏
  • 也只有你们博客园团队有这么专业解决问题的能力,换一般人早被搞跨了!  阿里云应该认真对待任何一点小的问题,一般来说在别处用的很好的程序在这里出问题,首先怀疑的应该是自己的服务有问题,而不是用户的程序有问题!
    2013-05-04 15:01:42
    赞同 展开评论 打赏
  • 呵呵  阿里还没有很完善
    2013-05-03 08:44:50
    赞同 展开评论 打赏
  • 支持博客园,把所有问题都放在阳光下,反对曝光的背后通常有利益牵扯。
    2013-05-02 23:52:15
    赞同 展开评论 打赏
  • 回3楼enj0y的帖子
    网站大了,压力大了自然问题多了.看楼主的文章可以学到不少知识那.非常感谢楼主分享
    2013-05-02 22:16:26
    赞同 展开评论 打赏
  • 回3楼enj0y的帖子
    这可能跟楼主的站点流量大,用到技术手段多有关系。相比之下,如果一个流量很小的网站,放了几个静态网页,我想放几年也不会出问题。
    2013-05-02 20:53:01
    赞同 展开评论 打赏
  • Re云计算之路阿里云上:5月1日下午飘过的一朵乌云
    再一次说明,阿里云slb在高占用、大流量的情况下不可靠。
    请你们正视你们的产品问题吧!
    2013-05-02 20:41:51
    赞同 展开评论 打赏
  • 为什么楼主总会遇到一堆问题呢
    2013-05-02 19:52:53
    赞同 展开评论 打赏
  • Re云计算之路阿里云上:5月1日下午飘过的一朵乌云
    说得好高深。。。我还没到达这个境界哈
    2013-05-02 18:59:30
    赞同 展开评论 打赏
  • Re云计算之路阿里云上:5月1日下午飘过的一朵乌云
    为什么都是事儿
    2013-05-02 18:58:06
    赞同 展开评论 打赏
滑动查看更多
问答排行榜
最热
最新

相关电子书

更多
云计算中的数据安全 立即下载
汇聚云计算的生态核能——云市场,云上APP Store 立即下载
天气风险管理的过去、现在与未来——基于大数据和云计算的天气风险管理 立即下载