Kudu入门_对比_列式和行式|学习笔记

简介: 快速学习Kudu入门_对比_列式和行式

开发者学堂课程【2020版大数据实战项目之DMP广告系统(第一阶段)Kudu入门_对比_列式和行式】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/676/detail/11752


Kudu入门_对比_列式和行式


列式存储和行式存储

行式和列式存储是不同的存储方式。其大致如下

image.png

1、行式存储

行式适合于比较精确的查询比较方便。行式存储会认为列式存储是不划算的,就可能一次只取出一小部分。那些没有取出来的就是对性能的提升。行式一般用作于 OLTP,例如我的订单,那不仅要看到订单,还要看到收货地址,付款信息,派送信息等,所以 OLTP 一般是倾向于获取整行所有列的信息。

2、列式存储

列式存储比较适合用于 OLAP 型,因为 OLAP 比较强调于查询和扫描性。如果是列式存储用不到中间那一列,可以不加载那一列,直接加载第一列或者第三列,那总体上数据量会少于三分之一,明显是非常大的性能提升。列式存储就有非常重要的假设,一次把一列的数据整出来,那么假设你要使用到这一列的大部分数据,如果按列存,就可以按列进行取舍,按行取舍不了那么多。例如当分析销售额的时候,那可能只对销售额这一列感兴趣,所以按照列存储,只需获取需要的列,这样能减少数据的读取量。

相关文章
|
存储 分布式计算 Hadoop
分布式数据库HBase的常用操作的对应的API编程接口
HBase是一个分布式数据库系统,基于Google的BigTable和Apache Hadoop的HDFS构建。它提供了一个高性能、可扩展的数据库平台,适用于大规模的数据存储和处理。在阿里云开发者社区中,很多开发者都会使用HBase进行数据存储和处理。本文将介绍HBase的常用操作及其对应的API编程接口。
505 0
|
9月前
|
SQL 消息中间件 Serverless
​Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
​Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
299 4
|
SQL 监控 数据处理
实时计算 Flink版产品使用合集之开启 MiniBatch 优化会引入乱序问题如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
324 0
|
存储 Kubernetes 调度
使用 Kubeadm 部署 Kubernetes(K8S) 安装 -- 持久化存储(NFS网络存储)
使用 Kubeadm 部署 Kubernetes(K8S) 安装 -- 持久化存储(NFS网络存储)
269 0
|
SQL 关系型数据库 MySQL
实时计算 Flink版产品使用问题之出现数据顺序错乱的情况,还怎么办
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
SQL Java 关系型数据库
SpringBoot+Mybatis Plus+ClickHouse入门教程
SpringBoot+Mybatis Plus+ClickHouse入门教程
1446 0
SpringBoot+Mybatis Plus+ClickHouse入门教程
|
存储 SQL 消息中间件
基于 Flink & Paimon 实现 Streaming Warehouse 数据一致性管理
字节跳动基础架构工程师李明,在 Apache Paimon Meetup 的分享。
15210 5
基于 Flink & Paimon 实现 Streaming Warehouse 数据一致性管理
|
Kubernetes 流计算 混合部署
Flink 数据集成服务在小红书的降本增效实践
实时引擎研发工程师袁奎,在 Flink Forward Asia 2022 数据集成专场的分享。
864 0
 Flink 数据集成服务在小红书的降本增效实践
|
负载均衡 Java 索引
Spring Cloud:自定义 Ribbon 负载均衡策略
Spring Cloud:自定义 Ribbon 负载均衡策略
|
存储 NoSQL 数据库
分库分表以后的多维度查询问题
分库分表以后的多维度查询问题