开发者社区> 问答> 正文

如何保证大规模集群的稳定性?

如何保证大规模集群的稳定性?

展开
收起
游客o46zkeyqg2dhw 2021-12-14 17:18:57 1158 0
1 条回答
写回答
取消 提交回答
  • 在性能这块之外,之前也遇到诸如稳定性方面的包括网络、故障等问题,导致 Elasticsearch 集群和服务不是很稳定,我们需要实时给客户提供一个稳定的服 务。这方面我们使用了阿里云 Elasticsearch 服务,利用多可用区容灾,包括日 志监控、网络监控以及一些报警规则的设置,来实时的进行监控,提升整个系统 的稳定性。在权限管控这块采用 proxy 的方式,所有的业务方通过代理接进来。 在代理之上做了权限、限额和熔断,还包括数据的路由,其实对于业务方不需要 知道它的数据在哪个 Elasticsearch 集群上,这样的话也方便做一些迁移。当某 个集群不稳定,我们可以及时做数据的迁移从而保证可用性,包括对重要的数据 做一些灾备,通过两个集群提供服务,这样一个集群出现问题的时候,服务也不 会受到影响。

    资源来源于《Elasticsearch 中国开发者调查报告》下载地址:https://developer.aliyun.com/topic/download?id=59

    2021-12-14 18:21:05
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
千万QPS分布式系统架构设计和高效运维 立即下载
构建确定性弹性的高可用云上应用网络 立即下载
Twitter 千万 QPS 分布式系统的架构设计和高效运维 立即下载