开发者社区> 问答> 正文

OpenSearch的字段类型和分词类型有哪些?



字段类型说明


数据推送到OpenSearch后会先保存到离线数据表中,在此阶段,为了方便用户推送数据,数据表允许用户根据实际业务场景定义多个表(需要指定关联字段),并提供了数据处理的插件。数据处理完毕后会join成一张索引表,这种索引表主要定义搜索属性,供引擎构建索引及查询使用。
这里分别介绍下数据表与索引表的字段对应关系。

数据表字段


数据表主要为数据导入时使用,不同的数据处理插件对类型有不同的要求,这里只是初步类型选择,下一步将有更细化的类型。具体字段取值范围,请参见 系统限制-字段相关部分说明。超过取值范围将溢出或者截断,请务必保证选择类型正确。

类型说明
INTint64整型
INT_ARRAYint64整型数组
FLOAT浮点型
FLOAT_ARRAY浮点型数组
DOUBLE浮点型
DOUBLE_ARRAY浮点型数组
LITERAL字符串常量,仅支持精确匹配
LITERAL_ARRAY字符串常量数组,单个元素仅支持精确匹配
SHORT_TEXT短文本,长度在100字节内,支持若干分词方式
TEXT长文本,支持若干分词方式


索引表字段


对于INT及FLOAT类型介绍这里不再累赘(限制详见 系统限制),重点介绍下各字段类型。

主要类型介绍


搜索效果如何跟分词有很大的关系,分词方式直接影响最终的搜索效果展示,目前系统支持若干的分词方式,需要根据实际业务场景的需求选择合适的字段类型。
接下来,我们详细说明下各个字段的展现效果及适用场景,供大家参考。

不分词


不分词,适合一些需要精确匹配或者只展示不搜索的场景,如标签、关键词、url等。LITERAL、INT类型可选。



展开
收起
轩墨 2017-10-25 10:11:18 2601 0
0 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
《开放搜索统一召回引擎实践》 立即下载
《开放搜索查询分析服务架构分享》 立即下载
《开放搜索在智能化行业搜索和业务增长领域的应用实践》 立即下载