zookeeper与etcd

本文涉及的产品
云原生网关 MSE Higress,422元/月
注册配置 MSE Nacos/ZooKeeper,118元/月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
简介: 背景最近在看到Pachyderm的介绍时,看到作者拿YARN和Kubernetes做类比,拿Zookeeper和etcd做对比。

背景

最近在看到Pachyderm的介绍时,看到作者拿YARN和Kubernetes做类比,拿Zookeeper和etcd做对比。YARN和Kubernetes的类比还相对比较好理解,毕竟他们都有资源管理和调度的职能,只不过YARN上运行的对象是JVM,而Kubernetes上运行的是容器。但是拿Zookeeper和etcd来类比我就有些不懂了,在我之前的概念里zookeeper并不是一个存储组件啊,因此有了本文的过程。
我的个人博客 http://www.wangjialong.cc

Zookeeper和etcd可以做类比吗?

etcd的官网介绍是一个分布式的K/V存储,而Zookeeper的官网介绍是一个高度可用的分布式协调者。看起来他们做的事情完全不同啊,那我们来比较一下功能介绍。

功能 etcd Zookeeper
分布式锁
watcher
一致性算法 raft zab
选举
元数据(metadata)存储
  • watcher指的是订阅/通知,当一个值改变时,通知订阅过的节点,在etcd中是K/V值对的改变,在Zookeeper中是znode的改变(值改变、节点删除等)
  • raft和zab都是paxos算法的变形,都是为了解决分布式系统中的读写一致性问题
  • 选举都是通过相应的一致性算法实现的

功能总结的不到位,欢迎补充

从功能上看,他们干的事好像也都差不多,分布式的一致性、选举算法、分布式锁,那么,我们来看一下各自的典型应用吧。

应用场景 etcd Zookeeper
发布与订阅(配置中心)
软负载均衡
命名服务(Naming Service)
服务发现
分布式通知/协调
集群管理与Master选举
分布式锁
分布式队列

分别参考了ZooKeeper典型应用场景一览ETCD:从应用场景到实现原理的全方位解读

zookeeper可以作为分布式存储吗?

在应用场景上,etcd和Zookeeper也很一致,难道Zookeeper本质上是分布式存储组件,为此,我查了下 Zookeeper是否可以作为分布式存储系统? 在知乎上的答案为 zookeeper只存元数据,总结几点原因如下

  • znode只能存1M以内的数据
  • 写入性能低,为保证一致性,每次需要n/2+1的写入完成才算完成
  • zookeeper的数据是全部存储在内存,只适合存元数据
  • Zookeeper的使用场景是有高一致性的

所以,逻辑上来说,可以。因为Zookeeper本质上是一个内存式的文件系统,它的znode就相当于dictionary和file的结合体,但是由于性能和存储容量以及使用场景来看,Zookeeper适合存有强一致性要求的配置信息,也就是元数据。

到这一步,基本搞清楚了Zookeeper的应用场景了,如果etcd可以和Zookeeper作类比的话,难道etcd不是一个分布式存储组件?

etcd究竟是干啥的?

回到etcd的官方文档,在Reference下看到一个etcd versus other key-value stores目录,发现了etcd的名称由来,原来它是”/etc”和”d” for distributed 的结合体, 它存的也是大型分布式系统的配置信息,也就是distributed “/etc”

到此可知,Zookeeper和etcd解决的问题是一样的,都解决分布式系统的协调和元数据的存储,所以它们都不是一个存储组件,或者说都不是一个分布式数据库。etcd灵感来源于Zookeeper,但在实现的时候有了很多的改进。

  • 更轻量级、更易用
  • 高负载下的稳定读写
  • 数据模型的多版本并发控制
  • 稳定的watcher功能,通知订阅者监听值的变化
  • 客户端协议使用gRPC协议,支持go、C++、Java等,而Zookeeper的RPC协议是自定制的,目前只支持C和Java
  • 可以容忍脑裂现象的发生

脑裂现象指的是,在一个分布式集群中,只允许一个leader协调工作,由于网络或其他原因,导致一个集群分成了两个集群,产生了两个leader同时工作,此时集群不在具备读写一致性。

etcd是使用raft算法解决的脑裂问题,raft算法具体参考 大神制作的动画

关于脑裂现象的一些推荐资料

总结

之前在使用etcd的时候,只是在官网看到了分布式存储,就默认它为一个存储组件,导致了对etcd的误解,这也是第一次用到的时候没有深入了解导致的,在经过和Zookeeper的比较学习之后,发现两者在很多方面有着相同的特性。以前我对Zookeeper也有一定的误解,以为它是一个协调者,一定有管理的功能,可以控制很多东西,但经过这番学习之后,发现其实Zookeeper本质上也是一个存储单元,用于存放配置信息,解决分布式中的读写一致性问题。总的来说,etcd和Zookeeper有相似的功能,做的事情也大同小异,只是可能具体的应用场景不太一样,我目前的了解是Zookeeper主要用于Hadoop组件的协调上,etcd主要用与Kubernetes上对于容器的协调上,两者都是用于存放配置信息等元数据的,随着以后的深入学习,希望可以慢慢把他们的区别理清晰。

唉,学习就像解bug,当我知道哪错了的时候,离真相也就不远了 (ಥ_ಥ)

相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
目录
相关文章
|
存储 自然语言处理 运维
服务发现比较:Consul vs Zookeeper vs Etcd vs Eureka
这里就平时经常用到的服务发现的产品进行特性的对比,总的来看,目前Consul 自身功能,和 spring cloud 对其集成的支持都相对较为完善,而且运维的复杂度较为简单,Eureka 设计上比较符合场景,但还需持续的完善。
5297 0
|
8月前
|
算法 Java Go
ETCD(六)ETCD和Zookeeper
ETCD(六)ETCD和Zookeeper
178 0
|
存储 网络协议 算法
注册中心原理和选型:Zookeeper、Eureka、Nacos、Consul和Etcd(二)
经过近2周的学习,原来注册中心除了ETCD和Zookeeper,常用的还有Eureka、Nacos、Consul,下面我们就对这些常用的注册中心,初探它们的异同,便于后续技术选型。
2702 0
注册中心原理和选型:Zookeeper、Eureka、Nacos、Consul和Etcd(二)
|
缓存 Kubernetes 负载均衡
注册中心原理和选型:Zookeeper、Eureka、Nacos、Consul和Etcd(一)
经过近2周的学习,原来注册中心除了ETCD和Zookeeper,常用的还有Eureka、Nacos、Consul,下面我们就对这些常用的注册中心,初探它们的异同,便于后续技术选型。
771 0
注册中心原理和选型:Zookeeper、Eureka、Nacos、Consul和Etcd(一)
|
存储 分布式计算 监控
服务发现:Zookeeper vs etcd vs Consul
服务发现:Zookeeper vs etcd vs Consul
378 0
|
存储 Kubernetes Shell
zookeeper和etcd有状态服务部署
zookeeper和etcd有状态服务部署实践   docker  etcd  zookeeper  kubernetes  4k 次阅读  ·  读完需要 78 分钟 0 一.
2208 0
|
存储 监控 数据中心
Zookeeper vs etcd vs Consul
Zookeeper vs etcd vs Consul 【编者的话】本文对比了Zookeeper、etcd和Consul三种服务发现工具,探讨了最佳的服务发现解决方案,仅供参考。
2166 0
|
存储 监控 数据中心
服务发现:Zookeeper vs etcd vs Consul
本文讲的是服务发现:Zookeeper vs etcd vs Consul,【编者的话】本文对比了Zookeeper、etcd和Consul三种服务发现工具,探讨了最佳的服务发现解决方案,仅供参考。
2558 0
Zookeeper,etcd,consul内部机制和分布式锁和选主实现的比较
我的另外3篇文章分别介绍了Zookeeper,etcd,consul是如何实现分布式锁和选主的。本文想比较一下Zookeeper、etcd、consul内部机制有哪些不同,他们实现锁和选主的方式相同和不同。
7239 0
|
4月前
|
安全 应用服务中间件 API
微服务分布式系统架构之zookeeper与dubbo-2
微服务分布式系统架构之zookeeper与dubbo-2