对Confluent一些解读

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 对Kafka母公司Confluent IPO、产品、技术一些看法

历史

大部分人应该都不知道Confluent,但Kafka绝对是无人不知谁人不晓热门话题。没错,Confluent是Kafka商业化母公司。说到Kafka很多人应该知道Jay Krep故事,Jay原先是Linkedin工程师,在面临大量数据孤岛问题时研发了Kafka,由于性能好、开源、又符合大数据发展的阶段需求从而一路走红,几乎成为了Pub-Sub,消息队列、数据传输等场景的标配。Kafka背后诞生过程并非一蹴而就,而是有大量对于工作场景的抽象,详见2013年前他在Linkedin上发表过一篇广泛传播的文章《The Log: What every software engineer should know about real-time data's unifying abstraction》

Kafka在2012年开源,在那个时代前后诞生了很多开源软件公司,例如MongoDB、ElasticSearch、Hadoop等,笔者认为一个重要的原因是大数据时代开始了,新工具在增量时代中快速增长,而大厂背书的开源项目是快速扩张的的首选。但和其他几家公司不同的是,Confluent是在Kafka流行后2年再成立的,在一些产品功能究竟应该是“获客的免费功能”还是“商业化License”这两个选项上摇摆,有点错过发展最佳阶段。

Confluent历史上重要时间点如下:

  • 2012年:kafka开源
  • 2014年:Jay离开Linkedin,成立商业化公司
  • 2017年:推出Confluent Cloud云托管模式
  • 2018年:推出KsqlDB,试图向下游的流计算进军
  • 2019年:获得了100M$ ARR
  • 2020年:获得1000个付费客户,Confluent Server推出
  • 2021年:官方版本在生态支持了超过120个插件,商业化,获得2500个付费客户

其中在2018年后期,Confluent将Apache 2.0 证书切换为 Confluent Community License,理由和ES/MongoDB比较一致,理由是:云供应商(AWS、MS、Alibaba、Google)利用开源软件来进行服务化,从而盈利,没有贡献开源但吃了开源的红利。对于ES/MongoDB、云厂商是没有替换方案的,AWS只能靠Fork分支来正面硬杠,其他几家选择的是合作。而在Confluent替代品上,几乎所有云厂商都有服务化替代方案,例如Kinesis、EventHub等,议价能力稍显不足。

目标市场

Confluent讲的故事提炼为3个趋势:

  • 所有公司都需要数字化、都需要软件
  • 业务模式越来越趋向于实时化,用以提升用户体验等竞争力:例如微服务、IoT、机器学习等
  • 数据引力(数据吸引数据)、网络效应两个飞轮让基于数据的公司保持竞争力

这些趋势背后有一股“神秘力量”在支配,也就是Confluent认为的“Data At Rest”转移至“Data In Motion”。数据只有实时流动才能诞生更大的价值,也能体现出管道的价值。
image.png

Confluent认为市场规模是500亿$市场(细分如下),该市场到2024年预计会达到910亿$,年复合增长率为22%。

领域 规模(B$)
Applicaiton Information & Middleware 31
Data Management Systems 7
Analytics and BI 7
Data Integration Tools 4
==Total== 50

当然竞争者也非常多,可以分为三类:

  • 各个云厂商类似的服务化产品
  • 数据产品厂商一般内置管道类产品
  • CNCF等标准虽没有实体产品,但定义了一系列标准

image.png

Confluent提供产品

商业化产品有3大类:

  • 主营产品:Confluent Platform,Confluent Cloud
  • 支撑产品:无法单独购买,主要用来给楼上引流,例如应用市场中的各种插件
  • 咨询服务类:例如专家服务,培训等

image.png

1. Confluent Cloud(PayAsYouGo)

该模式是最推荐的:

  • 把云计算基础设施供应链化,可以根据地域按需创建Confluent资源。
  • 根据可用性、安全等企业特性分为3个版本:Basic、Standard、Dedicated。
  • 按量收费,无需关注细节,提供3个月免费额度。

image.png

2. Confluent Platform(Subscription)

提供了Apache kafka非开源商业特性,通过订阅购买,包含:

  • 上下游工具:Kafka Stream、Connector
  • 组件:KsqlDB、Schema Registry、Rest Proxy等
  • 其他商业化特性等

3. Hub

截止2021年6月,共提供204个插件,可以认为是Kafka上下游的应用市场,主要目的是为商业版本引流,这里不再开了。
image.png

财务数据分析

根据S1提交的表格,我们把一些关键指标摘录出来:

营收

  • FY20营收为$236M,FY19为$149M,同比为58%
  • 营收构成:Confluent Platform(订阅模式)占比79%,Confluent Cloud 占比21%,后者在不断增长
  • 国际营收:占比从FY19 34% 增长到FY20的 36%

image.png

付费用户数

  • 1500(FY19)-> 2500 (FY20)
  • 每年消费超过100K$用户数:347(FY19)-> 561 (FY20)
  • 每年消费超过1M$用户数:33->60
  • Fortune 500企业中:

    • 有137家是付费客户,YoY 27%,占据所有营收的37%
    • 保守估计有70%(约350家)在使用,包含免费模式
  • 整体平均客单价:$10W/每年

SaaS核心指标(Retention)

分别为:134%(FY19),125%(FY20),117%(2021 Q1),说实在的在增长阶段这个指标并不是很理想。Confluent自己认为的主要原因是:

  • 大客户账号合并(按账号统计)
  • Covid19影响
  • Confluent Platform转为Cloud的过程(可能存在免费额度)

毛利率(Margin)

FY19毛利率为67%,比预料得低,Confluent理论上应该是价值型公司,可以在云资源上卖高溢价的。这个数值低于SaaS平均毛利率75%,可能和增长阶段有关。

运营成本(Operation Cost)

  • 研发(R&D):$105M
  • 销售与市场(S&M):$166M (占比营收70%)
  • 行政(G&A):$122M(意外的高,不确定增长是否为了做后期盈利)

image.png

历史融资与估值

  • 累计:$456M来自 Index, Sequoia, Altimeter, and Coatue
  • 最后一轮(E轮):$250M(2020年4月),估值$4.5B
  • 现金等价物:$280M
  • 员工数:S1未透露

个人粗浅看法

从S1财务指标来看,Confluent指标并不突出,主要体现在:

  • 留存率和获客不理想,在增长阶段留存率应该保持增长,而目前留存正在下降
  • 最后E轮估值过高($4.5B),几乎对标Cloudera市值
  • 竞争对手激烈,管道附加值低,容易被模范
  • 上下游发展不畅,下游核心产品KsqlDB被寄予厚望(in the earily stage of adoption),但用户并不买账,更喜欢用Flink
  • 高管退出影响:3位创始人中的Neha(获得过全球影响力女性)在2019年离职,并抛售了77.8M$股票

笔者一直是Kafka死忠粉,设计优雅、可读性强、场景应用广泛、性能好,几年前Confeluent Blog上每一篇文章都会去看。但随着时代发展,Queue单一系统可以替代的方案越来越多(服务化云厂商方案、开源方案如Pulsar)。而Kafka近几年大Feature除了去ZK依赖外似乎很少,而商业化KStream,KSQLDB实际上还是在模仿Flink一些理念,管道似乎就成了一个标准化的产品。

Confluent在两个核心赛道挑战如下:

  • 在数据分析领域,随着数据库(Data Lake)产生,Confeluent认为数据多源化、碎片化、建设无序的环境正在被统一。在数据湖中,更快批计算、流批一体混合模式慢慢起到实时效果。很有可能过几年,Confluent认为的“data in motion”就会变成数据湖内流动,留给Queue的空间越来越小。
  • 在应用开发领域,PubSub管道模式应该会长期存在,CNCF把Queue标准化后越来越多供应商进入,Pulsar等新开源软件的引入也是不小的挑战。

目前Confeluent面临市场很大,也有Kafka一手好牌,但竞争同样非常激烈,可以说是挑战与机遇并存。从开盘第一天的股价表现来看,大家对Confluent的增长还是非常期待的,让我们拭目以待吧。

目录
相关文章
|
22天前
|
消息中间件 分布式计算 大数据
RabbitMQ与大数据平台的集成
【8月更文第28天】在现代的大数据处理架构中,消息队列作为数据传输的关键组件扮演着重要的角色。RabbitMQ 是一个开源的消息代理软件,它支持多种消息协议,能够为分布式系统提供可靠的消息传递服务。本篇文章将探讨如何使用 RabbitMQ 与 Hadoop 和 Spark 进行集成,以实现高效的数据处理和分析。
15 1
|
21天前
|
消息中间件 存储 关系型数据库
实时计算 Flink版产品使用问题之如何使用Kafka Connector将数据写入到Kafka
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
4月前
|
消息中间件 Kafka Apache
Flink 提供了与 Kafka 集成的官方 Connector,使得 Flink 能够消费 Kafka 数据
【2月更文挑战第6天】Flink 提供了与 Kafka 集成的官方 Connector,使得 Flink 能够消费 Kafka 数据
118 2
|
4月前
|
消息中间件 存储 数据处理
实时计算 Flink版产品使用合集之有没有rocketMq的connector
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
100 1
|
11月前
|
消息中间件 监控 Java
一款开源的 Kafka 管理平台
Apache Kafka UI 是一个免费的开源 Web UI,用于监控和管理 Apache Kafka 集群,可方便地查看 Kafka Brokers、Topics、消息、Consumer 等情况,支持多集群管理、性能监控、访问控制等功能
|
消息中间件 存储 监控
聊聊 Kafka: Kafka 的基础架构
聊聊 Kafka: Kafka 的基础架构
100 0
|
消息中间件 运维 Cloud Native
StreamNative Cloud for KafkaⓇ新品发布!云上打通 Pulsar 与 Kafka
StreamNative Cloud for KafkaⓇ新品发布!云上打通 Pulsar 与 Kafka
134 0
StreamNative Cloud for KafkaⓇ新品发布!云上打通 Pulsar 与 Kafka
|
消息中间件 Java Kafka
|
存储 消息中间件 SQL
Sentry 监控 - Snuba 数据中台架构简介(Kafka+Clickhouse)
Sentry 监控 - Snuba 数据中台架构简介(Kafka+Clickhouse)
734 0
Sentry 监控 - Snuba 数据中台架构简介(Kafka+Clickhouse)
|
消息中间件 存储 SQL
Kafka监控必备——Kafka-Eagle 2.0.2正式发布
对于经常使用Kafka的同学,拥有一个炫酷又实用的监控系统是非常有必要的。可以实时的监控数据流的情况,了解实时数据流的变化。
348 0
Kafka监控必备——Kafka-Eagle 2.0.2正式发布

热门文章

最新文章