开发者社区 > 大数据与机器学习 > 检索分析服务 Elasticsearch版 > 正文

请问一下,Elasticsearch中为什么hive count的数量多于 es中查询的数量呢?

请问一下,Elasticsearch中用 es-hadoop 库,hive count的数量多于 es中查询的数量,是什么原因呀?

展开
收起
哈喽!小陈 2022-07-04 11:03:47 551 0
1 条回答
写回答
取消 提交回答
  • 十分耕耘,一定会有一分收获!

    楼主你好,可能的原因有以下几点:

    1. 数据的时间范围不一致。es-hadoop 库读取的数据范围和 hive 查询范围不一致,导致 count 数量不同。需要确认数据的时间范围是否正确。

    2. 数据重复。es-hadoop 库会读取所有符合条件的数据,而 hive 查询可能会过滤掉重复数据。需要确认是否存在数据重复的情况。

    3. 数据格式不一致。es-hadoop 库和 hive 读取数据的方式不同,可能导致数据格式不一致,从而影响 count 数量。需要确认数据格式是否一致。

    4. es-hadoop 库和 hive 的版本不一致。不同版本的 es-hadoop 库和 hive 可能存在差异,需要确认版本是否一致。

    需要具体分析数据和代码,才能确定问题的具体原因。

    2023-08-22 17:02:14
    赞同 展开评论 打赏

阿里云检索分析服务Elasticsearch版兼容开源ELK功能,免运维全托管,提升企业数据检索与运维分析能力。

相关产品

  • 检索分析服务 Elasticsearch版
  • 热门讨论

    热门文章

    相关电子书

    更多
    阿里云Elasticsearch体系架构与特性解析 立即下载
    开源与云:Elasticsearch应用剖析 立即下载
    《Elasticsearch全观测解决方案》 立即下载