OpenSearch如何聚合distinct子句？_问答-阿里云开发者社区

子句说明

聚合子句可以在一定程度上保证展示结果的多样性，以提升用户体验。如一次查询可以查出很多的文档，但是如果某个用户的多个文档分值都比较高，则都排在了前面，导致一页中所展示的结果几乎都属于同一用户，这样既不利于结果展示也不利于用户体验。对此，聚合子句可以对每个用户的文档进行抽取，使得每个用户都有展示文档的机会。

语法说明

子句语法格式为：dist_key:field,dist_count:1,dist_times:1,reserved:false

参数	类型	必需	取值范围	默认值	描述
dist_key	string	是			要聚合的字段
dist_times	int	否		1	抽取的轮数
dist_count	int	否		1	一轮抽取的文档数
reserved	true/false	否	true/false	true	是否保留抽取之后剩余的文档。如果为false，为不保留，则搜索结果的total（总匹配结果数）会不准确。
update_total_hit	true/false	否	true/false	false	当reserved为false时，设置update_total_hit为true，则最终total_hit会减去被distinct丢弃的的数目（不一定准确），为false则不减。
dist_filter	string	否			过滤条件，被过滤的doc不参与distinct，只在后面的排序中，这些被过滤的doc将和被distinct出来的第一组doc一起参与排序。默认是全部参与distinct。
grade	float	否			指定档位划分阈值，所有的文档将根据档位划分阈值划分成若干档，每个档位中各自根据distinct参数做distinct，可以不指定该参数，默认是所有文档都在同一档。档位的划分按照文档排序时第一维的排序依据的分数进行划分，两个档位阈值之间用 “\|” 分开，档位的个数没有限制。例如：1、grade:3.0 ：表示根据第一维排序依据的分数分成两档，(< 3.0)的是第一档，(>= 3.0) 的是第二档；2、grade:3.0\|5.0 ：表示分成三档，(< 3.0)是第一档，(>= 3.0，< 5.0)是第二档，(>= 5.0)是第三档。档位的先后顺序和第一维排序依据的顺序一致，即如果第一维排序依据是降序，则档位也是降序，反之亦然。

注意事项

distinct为非必选子句；
在distinct中出现的字段必须在定义应用结构的时配置为属性字段。
不支持array类型，只支持int和literal字段类型。
不支持指定多个 dist_key 。

distinct uniq插件

如上面描述，如果reserved=false情况下，会导致搜索结果中的total及viewtotal不准确，如果用户需要依赖于这个值进行翻页或者其他处理，则会有问题。为此，系统提供了distinct uniq的插件来解决在dist_times:1,dist_count:1,reserved:false的情况下的total及viewtotal展示不准确。在 kvpairs中添加duniqfield:field即可。
注意：

field必须与distinct子句中的dist_key一致；
该插件仅在在dist_times:1,dist_count:1,reserved:false查询下起作用，任何参数值有变化都将无效。
出于性能考虑，目前该插件最大支持total值为5000，即使真实搜索结果数超过5000，也会返回5000。

示例

查看create_time（创建时间）在1402301230之后且包含“浙大”的文档，并按照company_id字段进行聚合抽取10轮，每轮取2个结果，抽取后的文档排在后面：

OpenSearch如何聚合distinct子句？

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

OpenSearch如何聚合distinct子句？

相关文章

相关电子书

相关实验场景