持续九年,国际排名第一的宽表数据库概述|学习笔记

简介: 快速学习持续九年,国际排名第一的宽表数据库概述

开发者学堂课程【Cassandra数据库入门与实战持续九年,国际排名第一的宽表数据库概述】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/784


持续九年,国际排名第一的宽表数据库概述

我们正处在一个数据爆炸式增长的时代,随着5g,AI Iot等新兴技术和场景的出现,将加剧数据暴增,数据类型呈现多样化,关系型数据KV、宽表、文档、时序、图数据库等。

这些需求将对数据库领域带来新的挑战,如海量终端及数据导致的高并发、低延时、无线扩展、在线分析、极致可靠性等。

而cassandra就是这样一款,不仅能很好的满足现有应用,又是面向未来,可解决这些新问题的数据库,她也是一款国际上非常流行的数据库,过去12年里,在苹果、脸书、网飞、360、华为等很多国际化大公司都被应用在关键应用场景,在全球上万家企业,也有大规模成熟应用,

一、Apache Cassandra介绍

1、为什么要使用cassandra?

(1)分布式的海量数据储存和处理

(2)极高的性能

(3)极致的可靠性(去中心化的架构,无单点故障)

(4)优秀的线性可扩展能力

(5)对多地多数据中心部署的原生支持

(6)运维和管理需要理解的概念简单

(7)使用对开发者非常友好的类SQL语言CQL

(8)强大的生态,活跃的国际社区

(9)不断紧跟最新技术趋势,使他持续具有强大的生命力

二、学习cassandra的好处

(1)著名招聘网站DICE的年度工资调查,Cassandra一直被列为IT行业十大平均薪酬水平最高的技术之一

(2)对分布式系统的理解和动手能力—校招面试必杀技

(3)跟社区高手学习和交流

(4)提高你在职场的竞争力

二、DBEngine宽表数据库排名第一

4、国际社区的一些统计数据

Fortune前100强的企业90%都在使用cassandra

Linkedln上已有78000 cassandra专业人士,年增长率20%

72%的公司预计今年NoSQL使用会增加

186%增长C docker pulls

167490注册人员—DataStax Academy学院

三、构架基础和原理篇

1、Cassandra的起源

image.png

2、线性扩展

需要增加存储容量?

需要更多的数据吞吐量?

只要增加节点就好了!

3、Scale up垂直扩展和Scale out水平扩展

(1)垂直扩展需要增加单击硬件资源,最后单机的配置非常昂贵。

(2)水平扩展使用便宜得多的普通硬件资源不够了,只需要加更多的节点就好了。

4、数据是分布式储存的

5、Cassandra环的工作原理

image.png

在这个例子里,每一个节点负责一个范围,17号节点负责0到16,33号节点负责17到32,50号节点负责33到49,以此类推。

6、Cassandra多副本


image.png

7、节点故障

image.png

8、节点故障—恢复

image.pngimage.jpeg

9、数据的分布可以无处不在

10、CAP定理

image.png

11、Consistency Levels,一致性级别通常缩写为CL

image.png

我们在生态环境里边,大多数情况下,我们都会使用RF=3,对于刚开始使用Consistency的人来说,我们建议在生态环境中把复制因子设置为3,让数据库在高可用,高性能之间达到一个最佳的平衡,如果在将来,面对比较特殊的场景,可以考虑换成其他的复制因子。

image.png

四、应用场景

1、理解cassandra的应用场景

image.png

首先如果是需要数据库弹性扩展的需求,数据是海量、高吞吐量,有大量的写操作和读操作,像物联网这种应用场景,选择cassandra就是一种完美的选择。

如果需要数据库是高可用性,比如关键任务是不可以有数据丢失的,必须每一秒都在线,也非常适合用Cassandra。

2、各个行业的世界知名品牌都在使用Cassandra

3、典型的应用场景

image.png

4、苹果 部署规模

5、Facebook/Instagram应用案例

6、纽约证券交易—所每天发生三十六亿手股票交易

五、趋势发展

1、面向未来的数据架构

image.pngimage.jpeg

我们现在正在设计一个面向未来的一种数据架构,这个核心还可以是cassandra,在这个基础之上,我们希望应用程序和开发语言,能够解放出来,能够让他们使用他们最拿手的应用

相关文章
|
7月前
|
人工智能 IDE 开发工具
寻找Cursor的替代品:10款AI编程工具深度评测与推荐·优雅草卓伊凡
寻找Cursor的替代品:10款AI编程工具深度评测与推荐·优雅草卓伊凡
5687 18
寻找Cursor的替代品:10款AI编程工具深度评测与推荐·优雅草卓伊凡
|
9天前
|
数据采集 人工智能 安全
|
4天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:七十、小树成林,聚沙成塔:随机森林与大模型的协同进化
随机森林是一种基于决策树的集成学习算法,通过构建多棵决策树并结合它们的预测结果来提高准确性和稳定性。其核心思想包括两个随机性:Bootstrap采样(每棵树使用不同的训练子集)和特征随机选择(每棵树分裂时只考虑部分特征)。这种方法能有效处理大规模高维数据,避免过拟合,并评估特征重要性。随机森林的超参数如树的数量、最大深度等可通过网格搜索优化。该算法兼具强大预测能力和工程化优势,是机器学习中的常用基础模型。
301 164
|
3天前
|
机器学习/深度学习 自然语言处理 机器人
阿里云百炼大模型赋能|打造企业级电话智能体与智能呼叫中心完整方案
畅信达基于阿里云百炼大模型推出MVB2000V5智能呼叫中心方案,融合LLM与MRCP+WebSocket技术,实现语音识别率超95%、低延迟交互。通过电话智能体与座席助手协同,自动化处理80%咨询,降本增效显著,适配金融、电商、医疗等多行业场景。
315 155
|
12天前
|
SQL 自然语言处理 调度
Agent Skills 的一次工程实践
**本文采用 Agent Skills 实现整体智能体**,开发框架采用 AgentScope,模型使用 **qwen3-max**。Agent Skills 是 Anthropic 新推出的一种有别于mcp server的一种开发方式,用于为 AI **引入可共享的专业技能**。经验封装到**可发现、可复用的能力单元**中,每个技能以文件夹形式存在,包含特定任务的指导性说明(SKILL.md 文件)、脚本代码和资源等 。大模型可以根据需要动态加载这些技能,从而扩展自身的功能。目前不少国内外的一些框架也开始支持此种的开发方式,详细介绍如下。
869 6