使用Apache IoTDB进行IoT相关开发的架构设计与功能实现(9)

简介: GROUP BY 语句为用户提供了三种类型的指定参数: 参数1:时间轴上的显示窗口 参数2:划分时间轴的时间间隔(应为正) 参数3:时间滑动步长(可选,不应小于时间间隔,如果未设置,则默认等于时间间隔)

降频聚合查询

本节主要介绍下频聚合查询的相关示例,使用分组依据子句,用于根据用户给定的分区条件对结果集进行分区,并聚合分区的结果集。IoTDB支持根据时间间隔和自定义滑动步长对结果集进行分区,不小于时间间隔,未设置则默认等于时间间隔。默认情况下,结果按时间升序排序。还可以使用Java JDBC用于执行相关查询的标准接口。

GROUP BY 语句为用户提供了三种类型的指定参数:

  • 参数1:时间轴上的显示窗口
  • 参数2:划分时间轴的时间间隔(应为正)
  • 参数3:时间滑动步长(可选,不应小于时间间隔,如果未设置,则默认等于时间间隔)

这三类参数的实际含义如下图5.2所示。其中,参数 3 是可选的。接下来,我们将给出三个典型的降频聚合示例:未指定参数 3、指定参数 3 和指定值过滤条件。

图5.2 三类参数的实际含义

不指定滑动步长的降频聚合查询

SQL 语句为:

  1. selectcount(status), max_value(temperature) from root.ln.wf01.wt01 group by ([2017-11-01T00:00:00, 2017-11-07T23:00:00),1d);

这意味着:

由于用户未指定滑动步长,因此 GROUP BY 语句将默认将滑动步长设置为与时间间隔相同的时间间隔,即 。1d

上面 GROUP BY 语句的第一个参数是显示窗口参数,它决定了最终的显示范围是 [2017-11-01T00:00:00, 2017-11-07T23:00:00)。

上面 GROUP BY 语句的第二个参数是划分时间轴的时间间隔。将此参数(1d)作为时间间隔,显示窗口的开始时间作为划分原点,将时间轴划分为几个连续区间,分别是[0,1d),[1d,2d),[2d,3d)等。

然后系统将使用 WHERE 子句中的时间和值过滤条件和 GROUP BY 语句的第一个参数作为数据过滤条件,得到满足过滤条件的数据(本例中为 [2017-11-01T00:00:00, 2017-11-07 T23:00:00]范围内的数据),并将这些数据映射到之前分段的时间轴(本例中每 1 天有映射的数据)从2017-11-01T00:00:00到2017-11-07T23:00:00:00)。

由于结果范围内都有每个时间段的数据要显示,因此 SQL 语句的执行结果如下所示:

指定滑动步长的降频聚合查询

SQL 语句为:

  1. selectcount(status), max_value(temperature) from root.ln.wf01.wt01 group by ([2017-11-01 00:00:00, 2017-11-07 23:00:00), 3h, 1d);

这意味着:

由于用户将滑动步长参数指定为 1d,因此 GROUP BY 语句将延长时间间隔,而不是默认。1 day3 hours

这意味着我们希望每天从 00-00-00 到 02-59-59 获取 2017:11:01 到 2017:11:07 的所有数据。

上面 GROUP BY 语句的第一个参数是显示窗口参数,它决定了最终的显示范围是 [2017-11-01T00:00:00, 2017-11-07T23:00:00)。

上面 GROUP BY 语句的第二个参数是划分时间轴的时间间隔。以此参数(3h)为时间间隔,以显示窗口的开始时间为划分原点,将时间轴划分为几个连续区间,分别是[2017-11-01T00:00:00、2017-11-01T03:00:00)、[2017-11-02T00:00:00、2017-11-02T03:00:00)、[2017-11-03T00:00:00、2017-11-03T03:00:00)等。

上面 GROUP BY 语句的第三个参数是每个时间间隔移动的滑动步长。

然后系统将使用 WHERE 子句中的时间和值过滤条件和 GROUP BY 语句的第一个参数作为数据过滤条件,得到满足过滤条件的数据(本例中为 [2017-11-01T00:00:00, 2017-11-07T23:00:00]范围内的数据),并将这些数据映射到之前分段的时间轴(本例中每 3 小时有映射的数据为每天从2017-11-01T00:00:00到2017-11-07T23:00:00:00)。

由于结果范围内都有每个时间段的数据要显示,因此 SQL 语句的执行结果如下所示:

指定值的降频聚合查询 过滤条件

SQL 语句为:

  1. selectcount(status), max_value(temperature) from root.ln.wf01.wt01 wheretime> 2017-11-01T01:00:00 and temperature > 20 group by([2017-11-01T00:00:00, 2017-11-07T23:00:00), 3h, 1d);

这意味着:

由于用户将滑动步长参数指定为 1d,因此 GROUP BY 语句将延长时间间隔,而不是默认。1 day3 hours

上面 GROUP BY 语句的第一个参数是显示窗口参数,它决定了最终的显示范围是 [2017-11-01T00:00:00, 2017-11-07T23:00:00)。

上面 GROUP BY 语句的第二个参数是划分时间轴的时间间隔。以此参数(3h)为时间间隔,以显示窗口的开始时间为划分原点,将时间轴划分为几个连续区间,分别是[2017-11-01T00:00:00、2017-11-01T03:00:00)、[2017-11-02T00:00:00、2017-11-02T03:00:00)、[2017-11-03T00:00:00、2017-11-03T03:00:00)等。

上面 GROUP BY 语句的第三个参数是每个时间间隔移动的滑动步长。

然后系统将使用 WHERE 子句中的时间和值过滤条件和 GROUP BY 语句的第一个参数作为数据过滤条件,得到满足过滤条件的数据(本例中为(2017-11-01T01:00:00,2017-11-07T23:00:00]且满足root.ln.wf01.wt01.温度>20)范围内的数据, 并将这些数据映射到之前分段的时间轴(在这种情况下,从 3-2017-11T01:00:00 到 00-2017-11T07:23:00,每天每 00 小时都有映射的数据)。

左开和右闭合范围

SQL 语句为:

  1. selectcount(status) from root.ln.wf01.wt01 group by((5, 40], 5ms);

在此 sql 中,时间间隔为左打开和右关闭,因此我们不会包含时间戳 5 的值,而是包含时间戳 40 的值。

我们将得到如下结果:

时间 count(root.ln.wf01.wt01.status)
10 1
15 2
20 3
25 4
30 4
35 3
40 5

使用 Fill 子句的降频聚合查询

在按填充分组中,分组依据子句不支持滑动步骤

现在,分组按填充仅支持last_value聚合函数。

在按填充分组中不支持线性填充。

上一个和以前的区别
  • PREVIOUS 将填充任何空值,只要存在它之前的值不是空值。
  • PREVIOUSUNTILLAST 不会填充时间在该时间序列的最后一个时间之后的结果。

SQL 语句为:

  1. SELECTlast_value(temperature)FROM root.ln.wf01.wt01 GROUPBY([8, 39), 5m) FILL (int32[PREVIOUSUNTILLAST])

这意味着:

使用上一页填充方式填充源下频聚合查询结果。

GROUP BY 语句中 SELECT 后面的路径必须是聚合函数,否则系统会给出相应的错误提示,如下所示:

最后一点查询

在 IoT 设备快速更新数据的场景中,用户对 IoT 设备的最新点更感兴趣。

最后一个点查询是以三列格式返回给定时间序列的最新数据点。

SQL 语句定义为:

  1. select last <Path> [COMMA <Path>]* from < PrefixPath > [COMMA < PrefixPath >]* <DISABLE ALIGN>

这意味着:查询并返回时间序列前缀 Path.path 的最后一个数据点。

结果将以三列表格式返回。

  1. | Time | Path | Value |

示例 1:获取 root.ln.wf01.wt01.speed 的最后一点:

  1. > select lastspeedfromroot.ln.wf01.wt01
  2. | Time | Path | Value |
  3. | --- | ----------------------- | ----- |
  4. | 5 | root.ln.wf01.wt01.speed | 100 |

示例 2:获取 root.ln.wf01.wt01 的最后一个速度、状态和温度点

  1. > select lastspeed,status,temperaturefromroot.ln.wf01.wt01
  2. | Time | Path | Value |
  3. | --- | ---------------------------- | ----- |
  4. | 5 | root.ln.wf01.wt01.speed | 100 |
  5. | 7 | root.ln.wf01.wt01.status | true |
  6. | 9 | root.ln.wf01.wt01.temperature| 35.7 |

自动灌装

在IoTDB的实际使用中,在进行时间序列的查询操作时,可能会出现某些时间点值为null的情况,这会阻碍用户的进一步分析。为了更好地反映数据更改的程度,用户希望自动填充缺失值。因此,IoTDB系统引入了自动填充功能。

自动填充功能是指在对单列或多列进行时间序列查询时,根据用户指定的方法和有效时间范围填充空值。如果查询点的值不为 null,则填充函数将不起作用。

注意:在当前版本中,IoTDB为用户提供了两种方法:先前和线性。上一种方法用以前的值填充空白。线性方法通过线性拟合填充空白。并且 fill 函数只能在执行时间点查询时使用。

填充功能

  • 上一个函数

当查询时间戳的值为 null 时,使用上一个时间戳的值来填充空白。形式化的先前方法如下(有关详细语法,请参见第 7.1.3.6 节):

  1. select <path> from <prefixPath> where time = <T> fill(<data_type>[previous, <before_range>], …)

所有参数的详细说明见表3-4。

**表3-4 以前的填充参数列表**

参数名称(不区分大小写) 解释
路径,前缀路径 查询路径;必填项
T 查询时间戳(只能指定一个);必填项
data_type 填充方法使用的数据类型。可选值为 int32、int64、浮点型、双精度型、布尔值、文本;可选字段
before_range 表示上一种方法的有效时间范围。当存在 [T-before_range, T] 范围内的值时,前一种方法有效。如果未指定before_range,before_range采用默认值default_fill_interval;-1 表示无穷大;可选字段

在这里,我们给出了使用前面的方法填充空值的示例。SQL 语句如下:

  1. select temperature from root.sgcc.wf03.wt01 wheretime= 2017-11-01T16:37:50.000 fill(float[previous, 1m])

这意味着:

由于时间序列 root.sgcc.wf03.wt01.temperature在 2017-11-01T16:37:50.000 为空,因此系统使用之前的时间戳 2017-11-01T16:37:00.000(时间戳在 [2017-11-01T16:36:50.000, 2017-11-01T16:37:50.000] 时间范围内)进行填充和显示。

,此语句的执行结果如下所示:

值得注意的是,如果在指定的有效时间范围内没有值,系统将不会填充null值,如下所示:

  • 线性法

当查询时间戳的值为 null 时,使用上一个和下一个时间戳的值来填充空白。形式化的线性方法如下:

  1. select <path> from <prefixPath> where time = <T> fill(<data_type>[linear, <before_range>, <after_range>]…)
相关文章
|
30天前
|
物联网 数据管理 Apache
拥抱IoT浪潮,Apache IoTDB如何成为你的智能数据守护者?解锁物联网新纪元的数据管理秘籍!
【8月更文挑战第22天】随着物联网技术的发展,数据量激增对数据库提出新挑战。Apache IoTDB凭借其面向时间序列数据的设计,在IoT领域脱颖而出。相较于传统数据库,IoTDB采用树形数据模型高效管理实时数据,具备轻量级结构与高并发能力,并集成Hadoop/Spark支持复杂分析。在智能城市等场景下,IoTDB能处理如交通流量等数据,为决策提供支持。IoTDB还提供InfluxDB协议适配器简化迁移过程,并支持细致的权限管理确保数据安全。综上所述,IoTDB在IoT数据管理中展现出巨大潜力与竞争力。
45 1
|
1月前
|
存储 分布式计算 物联网
Apache IoTDB进行IoT相关开发实践
当今社会,物联网技术的发展带来了许多繁琐的挑战,尤其是在数据库管理系统领域,比如实时整合海量数据、处理流中的事件以及处理数据的安全性。例如,应用于智能城市的基于物联网的交通传感器可以实时生成大量的交通数据。据估计,未来5年,物联网设备的数量将达数万亿。物联网产生大量的数据,包括流数据、时间序列数据、RFID数据、传感数据等。要有效地管理这些数据,就需要使用数据库。数据库在充分处理物联网数据方面扮演着非常重要的角色。因此,适当的数据库与适当的平台同等重要。由于物联网在世界上不同的环境中运行,选择合适的数据库变得非常重要。 原创文字,IoTDB 社区可进行使用与传播 一、什么是IoTDB 我
101 9
Apache IoTDB进行IoT相关开发实践
|
1月前
|
Java 持续交付 项目管理
Maven是一款基于Apache许可的项目管理和构建自动化工具,在Java开发中极为流行。
Maven是一款基于Apache许可的项目管理和构建自动化工具,在Java开发中极为流行。它采用项目对象模型(POM)来描述项目,简化构建流程。Maven提供依赖管理、标准构建生命周期、插件扩展等功能,支持多模块项目及版本控制。在Java Web开发中,Maven能够自动生成项目结构、管理依赖、自动化构建流程并运行多种插件任务,如代码质量检查和单元测试。遵循Maven的最佳实践,结合持续集成工具,可以显著提升开发效率和项目质量。
38 1
|
20天前
|
Apache 开发者 Java
Apache Wicket揭秘:如何巧妙利用模型与表单机制,实现Web应用高效开发?
【8月更文挑战第31天】本文深入探讨了Apache Wicket的模型与表单处理机制。Wicket作为一个组件化的Java Web框架,提供了多种模型实现,如CompoundPropertyModel等,充当组件与数据间的桥梁。文章通过示例介绍了模型创建及使用方法,并详细讲解了表单组件、提交处理及验证机制,帮助开发者更好地理解如何利用Wicket构建高效、易维护的Web应用程序。
14 0
|
2月前
|
存储 分布式计算 物联网
Apache IoTDB进行IoT相关开发实践
The article introduces IoTDB, an open-source time-series database designed for efficient management of IoT-generated data. It addresses challenges like real-time integration of massive datasets and security. IoTDB supports high-performance storage,
105 0
Apache IoTDB进行IoT相关开发实践
|
4月前
|
传感器 存储 机器学习/深度学习
物联网(IoT)简介:定义、技术与应用
【5月更文挑战第30天】物联网(IoT)是将物品通过嵌入式系统、传感器及通信技术连接至互联网,实现物物、物人交互和数据共享的技术。其关键包括传感器、通信、嵌入式系统、云计算和人工智能技术。物联网应用于智能家居、智慧城市、工业自动化、农业和健康医疗等领域,通过Arduino等平台可实现简单数据传输。随着技术发展,物联网将深远影响人们生活和工作方式。
372 3
|
15天前
|
存储 物联网 关系型数据库
PolarDB在物联网(IoT)数据存储中的应用探索
【9月更文挑战第6天】随着物联网技术的发展,海量设备数据对实时存储和处理提出了更高要求。传统数据库在扩展性、性能及实时性方面面临挑战。阿里云推出的PolarDB具备高性能、高可靠及高扩展性特点,能有效应对这些挑战。它采用分布式存储架构,支持多副本写入优化、并行查询等技术,确保数据实时写入与查询;多副本存储架构和数据持久化存储机制保证了数据安全;支持动态调整数据库规模,适应设备和数据增长。通过API或SDK接入IoT设备,实现数据实时写入、分布式存储与高效查询,展现出在IoT数据存储领域的巨大潜力。
29 1
|
24天前
|
消息中间件 存储 传感器
RabbitMQ 在物联网 (IoT) 项目中的应用案例
【8月更文第28天】随着物联网技术的发展,越来越多的设备被连接到互联网上以收集和传输数据。这些设备可以是传感器、执行器或其他类型的硬件。为了有效地管理这些设备并处理它们产生的大量数据,需要一个可靠的消息传递系统。RabbitMQ 是一个流行的开源消息中间件,它提供了一种灵活的方式来处理和转发消息,非常适合用于物联网环境。
48 1
|
17天前
|
机器学习/深度学习 人工智能 算法
物联网(IoT)就像是一个大型派对,无数的设备都在欢快地交流着信息
【9月更文挑战第4天】在这个万物互联的时代,物联网(IoT)犹如一场盛大的派对,各类设备欢聚一堂。然而,如何让这些设备互相理解并协同工作呢?这就需要机器学习与人工智能的助力。例如,智能空调通过学习你的使用习惯来调节温度,使你更加舒适;智能安防系统则能识别异常行为并及时报警,保障家庭安全。此外,智能农业、交通等领域也因机器学习和人工智能的应用变得更加高效。下面通过一个简单的温度预测代码示例,展示机器学习在物联网中的实际应用,让我们一起感受其强大潜力。
20 0
|
1月前
|
存储 传感器 监控
理解并利用物联网(IoT)数据的技术探索
【8月更文挑战第11天】物联网数据是数字化转型的重要资源。通过深入理解物联网数据的特性和价值,并采取有效的收集、处理和分析策略,我们可以更好地利用这些数据为企业决策提供支持、优化运营效率、创造新的商业模式并推动数字化转型的深入发展。

推荐镜像

更多