持续九年,国际排名第一的宽表数据库概述|学习笔记

简介: 快速学习持续九年,国际排名第一的宽表数据库概述

开发者学堂课程【Cassandra数据库入门与实战持续九年,国际排名第一的宽表数据库概述】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/784


持续九年,国际排名第一的宽表数据库概述

我们正处在一个数据爆炸式增长的时代,随着5g,AI Iot等新兴技术和场景的出现,将加剧数据暴增,数据类型呈现多样化,关系型数据KV、宽表、文档、时序、图数据库等。

这些需求将对数据库领域带来新的挑战,如海量终端及数据导致的高并发、低延时、无线扩展、在线分析、极致可靠性等。

而cassandra就是这样一款,不仅能很好的满足现有应用,又是面向未来,可解决这些新问题的数据库,她也是一款国际上非常流行的数据库,过去12年里,在苹果、脸书、网飞、360、华为等很多国际化大公司都被应用在关键应用场景,在全球上万家企业,也有大规模成熟应用,

一、Apache Cassandra介绍

1、为什么要使用cassandra?

(1)分布式的海量数据储存和处理

(2)极高的性能

(3)极致的可靠性(去中心化的架构,无单点故障)

(4)优秀的线性可扩展能力

(5)对多地多数据中心部署的原生支持

(6)运维和管理需要理解的概念简单

(7)使用对开发者非常友好的类SQL语言CQL

(8)强大的生态,活跃的国际社区

(9)不断紧跟最新技术趋势,使他持续具有强大的生命力

二、学习cassandra的好处

(1)著名招聘网站DICE的年度工资调查,Cassandra一直被列为IT行业十大平均薪酬水平最高的技术之一

(2)对分布式系统的理解和动手能力—校招面试必杀技

(3)跟社区高手学习和交流

(4)提高你在职场的竞争力

二、DBEngine宽表数据库排名第一

4、国际社区的一些统计数据

Fortune前100强的企业90%都在使用cassandra

Linkedln上已有78000 cassandra专业人士,年增长率20%

72%的公司预计今年NoSQL使用会增加

186%增长C docker pulls

167490注册人员—DataStax Academy学院

三、构架基础和原理篇

1、Cassandra的起源

image.png

2、线性扩展

需要增加存储容量?

需要更多的数据吞吐量?

只要增加节点就好了!

3、Scale up垂直扩展和Scale out水平扩展

(1)垂直扩展需要增加单击硬件资源,最后单机的配置非常昂贵。

(2)水平扩展使用便宜得多的普通硬件资源不够了,只需要加更多的节点就好了。

4、数据是分布式储存的

5、Cassandra环的工作原理

image.png

在这个例子里,每一个节点负责一个范围,17号节点负责0到16,33号节点负责17到32,50号节点负责33到49,以此类推。

6、Cassandra多副本


image.png

7、节点故障

image.png

8、节点故障—恢复

image.pngimage.jpeg

9、数据的分布可以无处不在

10、CAP定理

image.png

11、Consistency Levels,一致性级别通常缩写为CL

image.png

我们在生态环境里边,大多数情况下,我们都会使用RF=3,对于刚开始使用Consistency的人来说,我们建议在生态环境中把复制因子设置为3,让数据库在高可用,高性能之间达到一个最佳的平衡,如果在将来,面对比较特殊的场景,可以考虑换成其他的复制因子。

image.png

四、应用场景

1、理解cassandra的应用场景

image.png

首先如果是需要数据库弹性扩展的需求,数据是海量、高吞吐量,有大量的写操作和读操作,像物联网这种应用场景,选择cassandra就是一种完美的选择。

如果需要数据库是高可用性,比如关键任务是不可以有数据丢失的,必须每一秒都在线,也非常适合用Cassandra。

2、各个行业的世界知名品牌都在使用Cassandra

3、典型的应用场景

image.png

4、苹果 部署规模

5、Facebook/Instagram应用案例

6、纽约证券交易—所每天发生三十六亿手股票交易

五、趋势发展

1、面向未来的数据架构

image.pngimage.jpeg

我们现在正在设计一个面向未来的一种数据架构,这个核心还可以是cassandra,在这个基础之上,我们希望应用程序和开发语言,能够解放出来,能够让他们使用他们最拿手的应用

相关文章
|
SQL 运维 监控
TiDB集群故障排查与恢复
【2月更文挑战第28天】本章将详细探讨TiDB集群故障排查与恢复的方法。我们将介绍常见的故障类型、排查工具与步骤,以及故障恢复的策略与最佳实践。通过本章的学习,读者将能够掌握TiDB集群故障排查与恢复的技术,确保数据库的稳定性和可用性。
|
安全 Windows
【Azure Cloud Service】在Windows系统中抓取网络包 ( 不需要另外安全抓包工具)
通常,在生产环境中,为了保证系统环境的安全和纯粹,是不建议安装其它软件或排查工具(如果可以安装,也是需要走审批流程)。 本文将介绍一种,不用安装Wireshark / tcpdump 等工具,使用Windows系统自带的 netsh trace 命令来获取网络包的步骤
302 32
|
存储 SQL 数据库
触发器的设计、掌握存储过程的基本概念和创建、执行、删除方法。掌握数据库备份的方法和数据库恢复的方法。
这篇文章介绍了数据库中触发器的设计概念,包括创建、修改、删除触发器的方法,并通过实验内容教授如何使用SQL命令创建DML触发器以及如何利用触发器实现数据的完整性和自动化处理。
触发器的设计、掌握存储过程的基本概念和创建、执行、删除方法。掌握数据库备份的方法和数据库恢复的方法。
|
Java
java -jar 命令隐藏黑窗口
java -jar 命令隐藏黑窗口
591 0
|
JavaScript Java 测试技术
基于小程序的新闻资讯微信小程序+springboot+vue.js附带文章和源代码说明文档ppt
基于小程序的新闻资讯微信小程序+springboot+vue.js附带文章和源代码说明文档ppt
196 0
|
存储 弹性计算 JSON
云服务器日志备份的两种思路实践
## 1 背景 最近在做Incountry产品的SRE工作,由于线上的vault audit日志较大,导致磁盘利用率不足,需要对vault日志进行备份后并在机器上删除。初步考虑通过OSS来备份日志,以实现对日志文件备份的需求。 ## 2 思路一:通过ECS挂载OSS实现日志备份 参考文档:[通过云存储网关挂载OSS](https://help.aliyun.com/document_detail
1088 0
云服务器日志备份的两种思路实践
|
Ubuntu 异构计算
Ubuntu 18.04安装N卡驱动
Ubuntu 18.04安装N卡驱动
|
网络协议
IPv6的优势及 为什么要用IPv6?
IPv6是Internet Protocol Version 6的缩写,其中Internet Protocol译为“互联网协议”。IPv6是IETF(互联网工程任务组,Internet Engineering Task Force)设计的用于替代现行版本IPv4协议的下一代IP协议。目前IP协议的版本号是4(简称为IPv4),它的下一个版本就是IPv6。
1142 0
|
机器学习/深度学习 存储 Android开发