1.电商拼写纠错:OpenSearch 系统会对于用户输入的查询串进行拼写错误检查,计算查询词是否需要进行纠错,并给出纠错建议。对于明确的拼写错误会直接改写原始查询串,然后进行检索;对于可能的拼写错误将仍然使用原始查询串进行检索。
2.电商命名实体识别(NER):OpenSearch 系统将查询词分词后对每个语义单元进行需求识别,每个实体会被打上一个类型标签(共 36 种标签),比如品牌、品类、新品等。在系统中,标签重要性大致分为三档:高、中、低。标签重要性低的实体在查询中会被忽略,以扩大召回率;标签重要性高的实体会直接影响文本相关性的计算和类目预测训练。比如“耐克修身连衣裙”,实体识别的结果为“耐克 / 品牌 / 中”、“修身 / 款式元素 / 低”、“连衣裙 / 品类 / 高”。并且如果系统中默认的标签重要性不符合用户预期,用户也可以直接进行调配。
3.灵活干预:电商场景中查询语义理解功能是基于淘宝搜索多年沉淀的大数据训练,绝大多数情况下会为电商场景提供良好的查询分析效果,但是不同的业务场景都会有自身垂直的查询词可能未覆盖或者分析错误,所以开放搜索也支持可视化上传、管理干预词条,支持自定义词库的上传,支持灵活配置,即干预即生效,简单快捷,方便用户在业务中更加灵活地使用这一功能。
以上内容摘自《大数据工程师必读手册》电子书,点击https://developer.aliyun.com/topic/download?id=29可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。