带你读《Elastic Stack 实战手册》之40:——3.4.2.21.Aggregations(10)

简介: 带你读《Elastic Stack 实战手册》之40:——3.4.2.21.Aggregations(10)

《Elastic Stack 实战手册》——三、产品能力——3.4.入门篇——3.4.2.Elasticsearch基础应用——3.4.2.21.Aggregations(9) https://developer.aliyun.com/article/1229232


4、直方图聚合 histogram 和日期直方图聚合 date_histogram

 

1)基础用法

直方图聚合通常用来查看文档的分布情况,比如对产品价格进行间隔为1000进行分组聚合:


GET order/_search
{
  "aggs": {
    "histogram_test": {        
     "histogram": {         //聚合类型
       "field": "price",
       "interval": 1000        //分组间隔
     }     
    }
  }
}
结果:
"aggregations" : {
    "histogram_test" : {
      "buckets" : [
        {
          "key" : 7000.0,
          "doc_count" : 2
        },
        {
          "key" : 8000.0,
          "doc_count" : 2
        },
        {
          "key" : 9000.0,
          "doc_count" : 2
        }
      ]
    }
  }
}

通过结果可以看到价格为7000、8000、9000的文档数量都是2个。如果聚合结果很多,而我们又更关心数量多的文档情况,那么此时可以通过设置 min_doc_count(最小文档计数)参数来限制文档数小于多少的不展示。

 

一般来说,文档的分桶结果会基于数据本身。例如你的目的是要0-500的价格分桶,而数据只有100以上的,那么返回结果不存在100以下的桶。此时如果有此类需求,可以通过extended_bounds设置桶的最大值和最小值,强制返回聚合数量为0的结果。可以通过这种order更改计算结果的排序规则,_count 代表按照 doc_count 的值进行排序,默认为 desc; _key 代表按照 key 的字母顺序进行排序。

 

Date histogram 日期直方图的用法与 histogram 基本一致,只不过 interval 间隔上支持了日期的表达式。支持的表达式为: `year`, `quarter`, `month`, `week`, `day`, `hour`, `minute`, `second`。也可以使用固定间隔,支持表达式为:milliseconds (ms)、seconds (s)、minutes (m)、hours (h)、days (d)。返回结果支持使用 "format":"yyyy-MM-dd" 进行格式化。

 

5、范围聚合 range、时间范围聚合 date_range、ip范围聚合ip_range

 

1)基础用法

 

范围聚合通常用来统计用户自定义范围内的文档数量。通过 from 和 to 定义范围边界,结果包含 from 值但排除 to 值。

 

例如对产品价格7000-8000做聚合,可以看到结果命中了2个文档。


GET order/_search
{
  "aggs": {
    "range_test": {
    "range": {
      "field": "price",
      "ranges": [
    870         >   三、产品能力
        {
          "from": 7000,
          "to": 8000
        }
      ]
    }     
    }
  }
}
聚合结果:
"aggregations" : {
    "range_test" : {
      "buckets" : [
        {
          "key" : "7000.0-8000.0",
          "from" : 7000.0,
          "to" : 8000.0,
          "doc_count" : 2
        }
      ]
    }
  }

Elasticsearch 为了满足各类用户的需求,也提供了时间范围聚合 date_range、ip 范围聚合

ip_range 分别支持对日期和 ipv4 类型字段的聚合统计。

 

《Elastic Stack 实战手册》——三、产品能力——3.4.入门篇——3.4.2.Elasticsearch基础应用——3.4.2.21.Aggregations(11) https://developer.aliyun.com/article/1229229

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
Linux 网络安全 Python
linux后台运行命令screen的使用
linux后台运行命令screen的使用
974 2
linux后台运行命令screen的使用
|
存储 安全 Java
滚雪球学Java(60):深入解析Java中的Vector集合类!
【6月更文挑战第14天】🏆本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
430 59
滚雪球学Java(60):深入解析Java中的Vector集合类!
|
缓存 Ubuntu Linux
Linux环境下测试服务器的DDR5内存性能
通过使用 `memtester`和 `sysbench`等工具,可以有效地测试Linux环境下服务器的DDR5内存性能。这些工具不仅可以评估内存的读写速度,还可以检测内存中的潜在问题,帮助确保系统的稳定性和性能。通过合理配置和使用这些工具,系统管理员可以深入了解服务器内存的性能状况,为系统优化提供数据支持。
963 4
|
机器学习/深度学习 自然语言处理 算法
机器学习和深度学习之间的区别
机器学习和深度学习在实际应用中各有优势和局限性。机器学习适用于一些数据量较小、问题相对简单、对模型解释性要求较高的场景;而深度学习则在处理大规模、复杂的数据和任务时表现出色,但需要更多的计算资源和数据,并且模型的解释性较差。在实际应用中,需要根据具体的问题和需求,结合两者的优势,选择合适的方法来解决问题。
636 0
|
机器学习/深度学习 人工智能 算法
【人工智能】传统语音识别算法概述,应用场景,项目实践及案例分析,附带代码示例
传统语音识别算法是将语音信号转化为文本形式的技术,它主要基于模式识别理论和数学统计学方法。以下是传统语音识别算法的基本概述
1082 2
|
Kubernetes Java 数据库
GitHub置顶神作开源!世界名著《Spring实战(第6版)》全彩文档
今天给大家带来的是:[美] 克雷格·沃斯(Craig Walls) 著,张卫滨,吴国浩 译的 《Spring实战(第6版)》,也是最新的一版,本书是关于Spring核心特性的指南,延续了前几个版本一贯的清晰风格,带领你亲自动手,逐步构建出一个以数据库作为支撑的Web应用。
|
传感器 安全 物联网
物联网技术在智能家居安全中的研究与应用
物联网技术在智能家居安全中的研究与应用
391 0
|
C语言
C语言模块化程序设计探讨
C语言模块化程序设计探讨
363 0
|
机器学习/深度学习 人工智能 安全
利用AI逃避规则,黑客的舞台又出神技!
AI技术的发展催生了新型网络威胁。黑客利用AI生成恶意软件代码和钓鱼邮件,挑战传统YARA规则检测,通过微妙变异躲避安全筛查。AI也被用于欺诈和数据窃取,包括模拟高管进行诈骗及通过深度伪造影响操作。研究揭示了ASCII艺术形式的新攻击方式ArtPrompt,能诱导AI模型产生有害内容。面对AI网络钓鱼攻击,需提高警惕,通过检查发件人信息、留意邮件内容和避免点击不明链接来识别攻击;并采用更新安全软件、强化身份验证等策略加强防范。

热门文章

最新文章