开发者社区人工智能文章正文

Poly-encoder 架构

2022-06-16 615

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Poly-encoder 架构

Poly-encoders: architectures and pre-training strategies for fast and accurate 
                            multi-sentence scoring
 非官方github ： https://github.com/chijames/Poly-Encoder
                https://github.com/sfzhou5678/PolyEncoder

Poly-encoder 架构可以用于推荐和搜索领域，只要是涉及两个 sequence 的比较的情况，都可以应用 Poly-encoder。

在速度上优于 cross-encoder, 质量上优于 bi-encoder 。

可以和 StarSpace （一种 learn-to-rank 模型, 效果好于 FastText 和 SVM）, 以及最近邻库 FAISS 来使用。

视频讲解地址 https://www.zhihu.com/zvideo/1455299489448202240

https://blog.csdn.net/qq_43390809/article/details/113586877

https://blog.csdn.net/xixiaoyaoww/article/details/108525940

https://zhuanlan.zhihu.com/p/380867813

https://blog.csdn.net/choose_c/article/details/118270484

文章标签：

机器学习/深度学习

孙庚辛

JOYCE_Leo16

机器学习/深度学习 XML 自然语言处理

Transformer 架构—Encoder-Decoder

JOYCE_Leo16

800 2 2

ChatYU.

关系型数据库 MySQL Go

MySQL数据库安装（超详细完整步骤）

ChatYU.

1982 1 1

bailiantest1

存储自然语言处理算法

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

bailiantest1

2682 18 19

游客bhmgxanbwhyfe

9月前

缓存 NoSQL 关系型数据库

Redis和Mysql如何保证数据⼀致?

1. 先更新Mysql，再更新Redis，如果更新Redis失败，可能仍然不⼀致 2. 先删除Redis缓存数据，再更新Mysql，再次查询的时候在将数据添加到缓存中这种⽅案能解决1 ⽅案的问题，但是在⾼并发下性能较低，⽽且仍然会出现数据不⼀致的问题，⽐如线程1删除了 Redis缓存数据，正在更新Mysql，此时另外⼀个查询再查询，那么就会把Mysql中⽼数据⼜查到 Redis中 1. 使用MQ异步同步, 保证数据的最终一致性我们项目中会根据业务情况 , 使用不同的方案来解决Redis和Mysql的一致性问题 : 1. 对于一些一致性要求不高的场景 , 不做处理例如 : 用户行为数据 ,

游客bhmgxanbwhyfe

605 2 2

知冰

机器学习/深度学习自然语言处理搜索推荐

承上启下：基于全域漏斗分析的主搜深度统一粗排

两阶段排序(粗排-精排)一开始是因系统性能问题提出的排序框架，因此长期以来粗排的定位一直是精排的退化版本，业内的粗排的优化方向也是持续逼近精排。我们提出以全域成交的hitrate为目标的全新指标，重新审视了召回、粗排和精排的关系，指出了全新的优化方向

知冰

94255 3 5

阿里云大数据Al技术

机器学习/深度学习算法开发工具

大语言模型的直接偏好优化（DPO）对齐在PAI-QuickStart实践

阿里云的人工智能平台PAI，作为一站式的机器学习和深度学习平台，对DPO算法提供了全面的技术支持。无论是开发者还是企业客户，都可以通过PAI-QuickStart轻松实现大语言模型的DPO对齐微调。本文以阿里云最近推出的开源大型语言模型Qwen2（通义千问2）系列为例，介绍如何在PAI-QuickStart实现Qwen2的DPO算法对齐微调。

阿里云大数据Al技术

35641 2 6

芯在这

DataWorks 数据管理大数据

DataWorks操作报错合集之DataWorksUDF 报错：evaluate for user defined function xxx cannot be loaded from any resources，该怎么处理

DataWorks是阿里云提供的一站式大数据开发与治理平台，支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中，可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。

芯在这

272 0 0

专注算法的马里奥学长

机器学习/深度学习存储自然语言处理

Jieba分词模式详解、词库的添加与删除、自定义词库失败的处理

Jieba（结巴）是一个中文分词第三方库，它可以帮助我们将一段中文文本分成一个个独立的词语。Jieba具有以下特点：简单易用：Jieba提供了简洁的API接口，易于使用和扩展。可以快速地实现中文分词功能。高效准确：Jieba采用了基于前缀词典和动态规划算法的分词方法，能够高效准确地处理各种中文文本。支持多种分词模式：Jieba提供了三种分词模式：精确模式、全模式和搜索引擎模式，可以根据不同的应用场景选择合适的模式。

专注算法的马里奥学长

1860 0 1

智能引擎技术

机器学习/深度学习缓存自然语言处理

更加灵活、经济、高效的训练——新一代搜推广稀疏大模型训练范式GBA

近日，阿里巴巴在国际顶级机器学习会议NeurIPS 2022上发表了新的自研训练模式 Gloabl Batch gradients Aggregation （GBA，论文链接：https://arxiv.org/abs/2205.11048），由阿里妈妈事业部搜索广告团队和智能引擎事业部XDL训练引擎团队联合探索和研发。GBA的提出对阿里巴巴搜推广稀疏模型的训练范式带来了架构性的跨越式升级。本文将从GBA的设计思路、收敛性分析及工程实现等方面展开介绍，欢迎阅读交流。

智能引擎技术

1441 0 1

华章计算机

分布式计算算法大数据

《Hadoop与大数据挖掘》——2.5　K-Means算法原理及Hadoop MapReduce实现

华章计算机

7124 0 0

Poly-encoder 架构

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Poly-encoder 架构

热门文章

最新文章

相关电子书