赋能阿里多业务场景,达摩院自研向量检索引擎 Proxima 公开
随着 AI 技术的广泛应用以及数据规模的不断增长,向量检索作为深度学习中的主流方法,其具备的泛检索和多模态搜索的能力也将进一步得到发挥。物理世界的实体和特征,通过向量化技术进行表征和组合,映射到数字世界,借助计算机进行计算和检索,挖掘潜在逻辑和隐式关系,更智能的服务于人类社会。
未来,向量检索除了要面对数据规模的不断增长,算法上仍需要解决混合空间检索、稀疏空间检索、超高维、泛一致性等问题。工程上,面对的场景将越来越广泛,也越来越复杂,如何形成强有力的系统化体系,贯穿场景和应用,将是向量检索下一步发展的重点。
达摩院自研向量检索引擎Proxima在行业搜索中的应用
淘宝搜索推荐、视频搜索背后使用了什么样的检索技术?非结构化数据检索,向量检索,以及多模态检索,它们到底解决了什么问题?今天由阿里达摩院的科学家从业务问题出发,抽丝剥茧,深度揭秘达摩院内部技术,向量检索引擎 Proxima,以及在阿里云开放搜索产品行业模板能力的实践应用~
用户地址数据不规范、管理难?阿里云帮您0.1秒解决
近年来,人工智能、大数据、小程序等技术广泛应用,直播电商、社交电商、跨境电商海外仓等模式深化创新。面对新冠肺炎疫情带来的冲击,消费者的消费习惯正在发生改变,以抖音、快手为主的直播平台带来的直播红利快速爆发。在订单的狂欢之后,用户地址杂乱、不规范等问题也让企业花费较大人力、时间成本去解决。基于此,阿里云AI人工智能团队在充分调研市场后,通过超强的NLP算法致力于企业用户地址数据的抽取、结构化、纠错等,实现以人工智能降本增效。