CQL基本语法介绍|学习笔记

简介: 快速学习CQL:CQL基本语法介绍

开发者学堂课程【Cassandra数据库入门与实战CQL:实战快速搭建弹性web应用】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/784


CQL基本语法介绍

一、Cassandra简单介绍

1、Casandra的历史

Casandra的数据库是来自于两篇论文,其中之一是07年亚马逊发表的一篇Dynamo ,在他上面吸取了分布式的架构和思想,另一篇是谷歌的Bigtable,吸取了数据的组织的格式以及表的各种组织的格式。

总体架构

image.png

Cassandra的特性是能做到线性扩展,原因是因为他有一个去中心化的架构,他可以做到高可用,高可用主要是因为它是高副本的,能够保证它的可用性,还有一个是他超高的性能,这取决于它底层的LSM Tree Storage。

图片的左边是一个环,这个还叫DHD环,这个环上有五个节点,每个节点把这个还进行了一个划分,它的每一部分节点都对应一部分数据范围。节点把进行均匀的切分,能够保证每一个节点负责的范围是相对均匀的,这是他分布式层面的情况。

2、Cassandra的初步认识

image.png

在图的左边有abcde五个节点,单独分解b这个节点对应的组成模块,可以看到,最上层是网络层,下面是c ql parser,这个板块是CQL语言进行解析的一个模块,将CQL语言转换成编译的结果。

二、Cassandra CQL介绍

1、CQL是什么?

image.png

上图我们可以看到用Hbase k v api和CQL,去写一条数据的差别,CQL可以简单的写出一条数据,这是一个最原始的社区为什么要做一个cql的原因,就是让用户操作数据库简单化。

CQL总体介绍

Data type,定义的一些比较基础的数据类型,包括他自己实现的集合数据类型,除此之外,还有DDL/DML/ACL,这是他操作数据库一些基本的定义。

2、CQL的几个概念

Cluster,意思是集群最大的储存单位,Datecenter,是数据中心,一个cluster可以包含多个DC;Keyspace是键值空间,类似mysql的data base,定义了数据存储的副本策略,摆放策略下面包括多个表,所有表都遵循key pace的摆放策略;Table,意义是表,类似mysql的table,定义基本的表结构;Primary key意义是主键,可以唯一确定一行数据,由partition key和cluster key ke共同组成;Partition key是分区间,可以确定数据存储的节点;Cluster key意义是cluster键,可以在partition下进行排序,范围操作等;Regular column意义是普通列数据列。

(1)CQL date type

image.png

(2)Native Tapy

基本的string类型、数值类型、IP相关类型、UUIT、时间日期以及counter类型。

例子:

image.png

(3)Collect Type && UDT

UDT必须在key space范围内创建类型

支持:CREATE/ALTER/DROP

例子:

image.png

(4)CQL DDL

image.png

Keyspace

Replication:

Class:SimpleSttategy/NetworkTopologyStrategy:副本摆放策略

Replication_factor:副本数

例子:

image.png

(5)Table

Primary key:必须定义由partition key和cluster key组成

Partition key:必须定义确定数据的摆放物理位置

Cluster key:可以不定义,确定数据在partition下的摆放情况

Default time to live,表级别ttl;

Compaction策略:STCS/LCS/TWCS;

Compression,策略:SNAPPY/LZ4

例子:

image.png

(6)CQL DML

DML:SELECT/INSERT/UPDATE/DELETE/BATCH

SELCCT:

支持获取指定列以及通配符操作;

支持LIMIT/PARTITION LIMIT/ORDE BY/GOUP BY;

支持native function处理操作:Count、max、min、sum、avg等

支持JSON

其他多数丰富操作;

例子:

image.png

(7)UPDATE:

需要指定primary key

如果数据存在就更新,不存在则写入

DELETE:

支持行列、级别删除

例子:

image.png

(8)BATCH:

语法:BEIGIN BATCH 开始,以APPLY BATCH结束,中间可包含多条INSERT/UPDATE/DELETE;

支持LOGGED/UNLOGGED BATCH两种模式。LOGGED BATCH,保证batch数据最终全被写入

提高写入吞吐

例子:

image.png

3、CQL ACL

Role,级别操作支持账户密码role,资源操作

各种资源级别的鉴权

常见grant以及revoke操作

例子:

image.png

4、CQL INDEX

(1)SEcondary Index

Local index索引表数据和数据表数据共存,适用于奇数式中的数据列表

可以指定索引名,若不指定咋自动生成

Counter列不支持二级索引

频繁删除以及update的列不推荐使用

支持多重索引查询,支持集合数据类型上构建索引

(2)SASI:

Local index的一种,支持较多索引模式:prefix ,contain ,sparse支持轻搜索功能

对字符串支持的prefix和contains功能支持,轻模糊匹配

使用analyzer可以对某个列的文本数据做词干分析

丰富的索引构建选项,大小写敏感,索引模式,是否使用anlyzer

不支持collection类型

实验功能,不推荐生产使用

例子:

image.png

适用于任何规模的云原生多模数据库。

相关文章
|
JSON Java 测试技术
Python + Appium 自动化操作微信入门看这一篇就够了
Python + Appium 自动化操作微信入门看这一篇就够了
1612 0
Python + Appium 自动化操作微信入门看这一篇就够了
|
机器学习/深度学习 文字识别 TensorFlow
脚把脚教你利用PAI训练出自己的CNN手写识别模型并部署为可用的服务
虽然已经 9102 年了,MNIST手写数据集也早已经被各路神仙玩出了各种花样,比如其中比较秀的有用MINST训练手写日语字体的。但是目前还是很少有整体的将训练完之后的结果部署为一个可使用的服务的。大多数还是停留在最终Print出一个Accuracy。
3687 57
|
机器学习/深度学习 人工智能 算法
|
数据可视化 JavaScript 前端开发
Python 绘制精美可视化数据分析图表 (二)-pyecharts
画图表就是为了把复杂的事情表达清楚,画图表还可以弥补单用文字表达的缺欠,对有些事物解说更直接、更具体。就像我们平时会议所用的 PPT,能够更直观呈现讲述者所想表达的意思,且通俗易懂。总的来说,使用图表可以化复杂为简洁,化抽象为具体,使读者或听众更容易理解。 图表能跟直观表达和揭示数据的规律,人对图像更加敏感,对图文并茂的事物更容易接受,阅读更加简单高效,而且图表更显专业性,更具有说服力,更有利于沟通。 在上一篇文章《Python 绘制精美可视化数据分析图表 (一)-Matplotlib》中我们已经讲述过数据分析和绘制数据分析图表的好处,这里就不再赘述。直奔主题:pyecharts 是什么?
1012 0
|
Kubernetes Cloud Native 应用服务中间件
从零开始,在 Kubernetes 上玩转 Erda(一)
本章节主要介绍了使用 kubeadm 部署 Kubernetes,为部署 Erda 铺路
1855 1
从零开始,在 Kubernetes 上玩转 Erda(一)
|
开发工具 Docker 容器
docker登录harbor仓库时 提示:x509: certificate signed by unknown authority
docker登录harbor仓库时 提示:x509: certificate signed by unknown authority
1709 0
EMQ
|
消息中间件 缓存 监控
NanoMQ Newsletter 2022-08|v0.11:MQTT 5.0 + MQTT over QUIC 桥接,新增 HTTP API 监控客户端状态
八月,0.11.0版本发布:增加了MQTT 5.0+MQTT over QUIC桥接模式,新增和修复了对已连接客户端状态进行监控和查询的HTTP API。
EMQ
742 0
NanoMQ Newsletter 2022-08|v0.11:MQTT 5.0 + MQTT over QUIC 桥接,新增 HTTP API 监控客户端状态
|
存储 Java 调度
浅析数据库并发控制机制
数据库事务隔离发展标准 一文中,从标准制定的角度介绍了数据库的隔离级别,介绍了Read Uncommitted、Read Committed、Repeatable Read、Serializable等隔离级别的定义。本文就来看看究竟有哪些常见的实现事务隔离的机制,称之为并发控制(Concurrency Control)
692 0
|
安全 5G 网络性能优化
5G NR系统架构
5G网络的频率要比4G网络高,覆盖半径相较4G更小,5G网络基站密度比4G高,使得5G网络建设成本更高。因此NSA非独立组网被纳入考虑,4G与5G联合组网,可以有效减少5G推广压力。
934 0
5G NR系统架构
|
PyTorch 算法框架/工具 Windows
安装PyTorch后jupyter notebook中仍出现“No module named torch“
Jupyter Notebook 后 import torch 却提示 “No module named torch”
2018 0
安装PyTorch后jupyter notebook中仍出现“No module named torch“