开发者社区> 问答> 正文

OpenSearch行业算法版使用自定义分词

已解决

OpenSearch行业算法版使用自定义分词

展开
收起
提个问题 2024-06-10 16:04:47 52 0
1 条回答
写回答
取消 提交回答
  • 开发者社区问答官方账号
    官方回答
    采纳回答
    为了更好的满足用户的业务需求,OpenSearch行业算法版可以让用户在系统提供的基础分析器的基础上,通过结合干预词条的形式创建自定义分析器。在应用的索引字段的分析器中选择使用相应的分析器,以达到干预索引和查询时分词结果,确保搜索结果的质量。点此查看参考文档。批量添加自定义分词词条api,点此查看。(分词效果测试功能暂不支持api接口调用)。
    注意:目前新控制台可对已创建的自定义分析器可进行词条添加,若已创建的自定义分析器已经被应用引用,则期间再次添加词条,需要进行索引重建后才会生效;如想及时生效,需要对分词有bad case的文档进行重新更新,以触发对新增干预词条的索引重建。自定义分析器的Query长度不得超过10个字符自定义分析器的Query不允许包含大写字母,全角符号,中文标点自定义分词结果不允许包含大写字母,全角符号,中文标点当关闭二次分词开关后,则严格遵从用户的干预结果设置,不再进行进一步分词,反之,允许基于客户的干预结果后进行进一步分词自定义分词器类型“行业-电商通用分析器”需要版本类型为“行业算法模板”的应用才可以配置使用。已被应用引用的自定义分析器,无法删除。
    2024-06-10 16:04:48
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
数据+算法定义新世界 立即下载
袋鼠云基于实时计算的反黄牛算法 立即下载
Alink:基于Apache Flink的算法平台 立即下载