为什么选择Cassandra

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介: cassandra概况 为什么选择Cassandra?cassandra到底有那些令人印象深刻的特点呢?不急,我们先来看下cassandra目前的大体概况。 理论扎实,师出名门 cassandra不仅吸收了dynamo论文中的如何做分布式,如何做副本复制,故障容错等方面成功的经验,又吸取了google bigtable中的LSM单机引擎层面精华。

cassandra概况

为什么选择Cassandra?cassandra到底有那些令人印象深刻的特点呢?不防我们先来看下cassandra目前的大体概况。

理论扎实,师出名门

image
cassandra不仅吸收了dynamo论文中的如何做分布式,如何做副本复制,故障容错等方面成功的经验,又吸取了google bigtable中的LSM单机引擎层面精华。理论扎实,工程实现靠谱,所以面世以来,不断受到人们的追捧。

DB-EnginesRanking排名一骑绝尘

image
宽表领域第一,全部数据排名第十,可以看出广受用户认可,流行度颇高。

Nosql主流产品性能对比

image
从benchmark可以看到cassandra性能是摇摇领先的,受用户认可也是有原因的,毕竟能打,有实力。
摘自:https://www.datastax.com/nosql-databases/benchmarks-cassandra-vs-mongodb-vs-hbase

为什么选择cassandra

了解了cassandra概况,表现抢眼,再让我们深入看看,什么原因让我们选择cassandra
我大致总结了如下十点:

1.线性扩展,轻松应对速度,多样性和复杂性问题

与下一代云应用相关的许多挑战都集中在数据量和数据处理速度上。Cassandra能否有能力应对这种具有多样性的数据流量?答案是肯定的,Cassandra是线性扩展,可以根据前台数据流量轻松确定集群规模,处理能力不够?加一台节点试试。
image

2.可以处理大量数据集

Netflix,Hulu,Instagram,eBay,Apple和Spotify都在大规模使用Cassandra,作为他们产品后端的一部分。facebook的instangram一天用cassandra处理上亿图片,这足够说明了cassandra可以自如的处理大量数据集。

3. 一致化软硬件环境,易于大规模部署

不像有些分布式系统,cassandra不依赖外部组件,所有必须的操作都集成在cassandra内部了,因为是p2p对等架构,无主,环上的节点都是对等的,所以实际部署时,只需要一种机型,一个进程,极度简化部署及后续运维工作,适合大规模部署。

4. 高度容错

Cassandra采用了许多容错机制。由于C* 是无主的,所以没有单点故障。可以做到不停服滚动升级。这是因为Cassandra可以支持多个节点的临时失效(取决于群集大小),对群集的整体性能影响可以忽略不计。

Cassandra提供多地域容灾。Cassandra允许您将数据复制到其他数据中心,并在多个地域保留多副本。除了作为强大的灾难恢复和业务连续性保障之外,这有助于满足许多监管,离线分析等要求。
image
图示:多DC可用于多地容灾,或者离线分析用。

5. 被证明过,已经在企业应用程序和许多用例中取得成功

已经有许多Cassandra被有效使用的例子。银行和其他金融机构正在使用C*存储大量金融数据。分析公司正在使用Cassandra来存储网络分析数据。医疗公司正在使用Cassandra来存储传感器数据和其他时序数据。还有许多公司利用Cassandra存储物联网数据。所以说cassandra是被证明过的。

6.易于管理

Cassandra简化了系统管理。由于Cassandra是一个无主系统,环中的所有节点都是相同的; 一个同质的系统。它具有容错能力,可以支持节点临时失效,同时对性能的影响最小。这意味着节点易于更换,并且也不要求即刻替换宕机节点。

7.自主优化

有大量的,不同的参数让你根据自身场景不断的调优,举个例子,如果你是一个重写,读很少的场景,可以修改配置参数成重写系统。参数设置不仅仅是集群级别的,也可以是dc级别的,甚至客户端单个请求级别的,比如单次请求设置一致性级别,已达到更低的延时。
image
图示:调节一致性级别,达到更低延时目标

8.易于集成其他开源组件

Cassandra可以很容易的跟其他开源组件做集成。据我所知,cassandra已经成功跟kafka,spark,solr做集成,打通了大数据生态上下游,成为大数据处理里面重要的一环
image

9.出色的监控选项

cassandra提供了很多的监控指标,这些监控项这可以通过Cassandra利用Java MBeans并将它们暴露给不同外部监控系统,比如Datastax的监控系统Opscenter,阿里云的天象监控系统。您可以使用这些指标监控cassandra运行状况,再出现异常指标做出相应的决策。

10. 开源可控&活跃的社区

目前apache cassandra有5.4K Star,并且是开源可控,不需要昂贵的licence费用。stackoverflow上有数万个打了cassandra tag的问题,这些足以说明cassandra足够活跃。

一个开源软件要获得真正意义上的成功,就需要有一个围绕它发展的生态系统。对于像Cassandra这样的数据库,就必须有围绕它的咨询,监控和故障排查系统,插件,仪表系统和备份系统, 使得您的组织不需要重复开发上述一切能力,可以基于社区已有的内容。甚至很多云厂商提供Cassandra托管服务,让您只关注应用程序的开发。

总结

cassandra功能强大,更像一个真正的数据库,以下图总结来结束本文
image

Cassandra是您理想的数据库原因有很多。了解您的系统要求,工作负载和未来业务增长情况将有助于您做出正确的选择。如你所见,选择Cassandra是一个十分明智的选择。

钉钉群交流

为了营造一个开放的 Cassandra 技术交流,我们建立了微信群和钉钉群,为广大用户提供专业的技术分享及问答,定期在国内开展线下技术沙龙,专家技术直播,欢迎大家加入。
image

钉钉群入群链接:https://c.tb.cn/F3.ZRTY0o

相关文章
|
6月前
|
存储 NoSQL 大数据
大数据存储:HBase与Cassandra的对比
【7月更文挑战第16天】HBase和Cassandra作为两种流行的分布式NoSQL数据库,在数据模型、一致性模型、数据分布、查询语言和性能等方面各有千秋。HBase适用于需要强一致性和与Hadoop生态系统集成的场景,如大规模数据处理和分析。而Cassandra则更适合需要高可用性和灵活查询能力的场景,如分布式计算、云计算和大数据应用等。在实际应用中,选择哪种数据库取决于具体的需求和场景。希望本文的对比分析能够帮助读者更好地理解这两种数据库,并做出明智的选择。
|
存储 分布式计算 NoSQL
HBase和Cassandra的分布式架构深度对比
HBase和Cassandra几乎都是一个时候出现的,都是在2010年成为Apache的顶级项目,不过如果我们细品其内部机制,我们会发现其实两者是完全不同的架构风格。HBASE起源于Google BigTable,几乎遵从了BigTable论文的大多数架构设计。Cassandra则是采纳了BigTable的数据模型,同时吸收了Amazon Dynamo的分布式设计。因此从存储结构模型的微观上看,HBASE和Cassandra在单点存储数据的机理是类似的,但是从分布式架构的宏观上看,两者则大相径庭。
HBase和Cassandra的分布式架构深度对比
|
存储 SQL 分布式计算
MongoDB、Cassandra 和 HBase 三种 NoSQL 数据库比较
Hadoop 获得了许多大数据应用的信誉,但实际情况是,NoSQL数据库是一直处于更加广泛部署和更广泛的发展中的技术。尽管选择 Hadoop 作为应用存储,相对来说更直接简单。但是,具体采用什么样的 NoSQL 数据库是个值得思考的问题,毕竟,还有超过100种的 NoSQL 数据库。
3285 0
MongoDB、Cassandra 和 HBase 三种 NoSQL 数据库比较
|
存储 运维 自然语言处理
Cassandra 的过去、现在、未来
11月16日在北京,由DataFun和阿里云联合举办的首场Cassandra中文社区线下meetup,阿里云高级技术专家陈江分享了Cassandra的发展历程、优势特点、适合的使用场景、不推荐的场景,以及即将发布的4.0特性。
2466 0
Cassandra 的过去、现在、未来
|
存储 缓存 NoSQL
Cassandra存储引擎
1. cassandra 首先将客户端提交的数据和操作记录写入到 commitLog,其目的是:为了提升可靠性,起到数据恢复的作用 2. 接着 cassandra 将数据写入到 内存表 memtable 中, memtable 中 组织的数据 按照 key 排序。当 memtable 中的数据到达一定限制后(周期性 / 批量)flush 到 一个 SSTable 中。 这种机制,相当于 缓存 写回机制(write back cache),目的在于:将随机 IO 写改为 顺序 IO 写,大大降低了 写操作对于存储系统的压力。
1144 0
|
存储 运维 NoSQL
Cassandra 在 360 的实践与改进
2010年,Dropbox 在线云存储在国外被用户熟知,同时国内如360、金山、百度等各个厂商也都陆续推出了自家的网盘类产品;而在 "360云盘" 背后的存储技术支撑之一就是以 Cassandra 为基础的云端存储方案。自此,Cassandra 在360实现技术落地和大规模生产应用,并被持续改进优化,最终形成高峰时期超 10k+ 物理节点的使用规模,成为互联网公司中 Cassandra 生产环境落地规模最大的公司。
915 0
Cassandra 在 360 的实践与改进
|
NoSQL 分布式数据库 Hbase
|
NoSQL Apache
5个选择Apache Cassandra 而非DynamoDB的原因
5个选择Apache Cassandra 而非DynamoDB的原因
5417 0