带你读《2022技术人的百宝黑皮书》——ACL2022 自监督文本表示新框架ArcCSE(4)

简介: 带你读《2022技术人的百宝黑皮书》——ACL2022 自监督文本表示新框架ArcCSE(4)

带你读《2022技术人的百宝黑皮书》——ACL2022  自监督文本表示新框架ArcCSE(3) https://developer.aliyun.com/article/1243561?groupCode=taobaotech



这样可以构造存在蕴含关系的三元组triplet 。在少数情形下,构造的三元组可能不满足蕴含关系,但多数情形下蕴含关系成立。因此在分析大量数据后,模型会强化对正确信息的判别,噪声信息的影响较为有限。


由于三个文本语义相似,用encoder生成表示向量时如果dropout开启可能会引入额外的噪声,降低对蕴含关系信息的利用能力。因此在该部分建模中会关闭用于生成表示向量的encoder里的dropout。

image.png

image.png


image.png

综合以上两部分的建模,得到最终优化目标:


image.png

实验


本文在两类评估任务上进行了对比实验:


1. 无监督语义相似性任务(STS),主要评价模型判别文本语义相似度的能力

2. SentEval 迁移任务,评价文本表示向量迁移到下游任务时的效果


无监督STS任务


image.png

表1. 在STS任务上的文本表示的性能(Spearman's correlation)



由表1结果可以看到,将ArcCSE应用于BERT与SBERT预训练模型时,在base和large模型尺度上效果均有明显提升,超过此前的SOTA算法SimCSE。对比实验证明文章提出ArcCon优化目标和Triplet优化目标均可有效提升模型效果。



带你读《2022技术人的百宝黑皮书》——ACL2022  自监督文本表示新框架ArcCSE(5) https://developer.aliyun.com/article/1243559?groupCode=taobaotech

相关文章
|
分布式计算 负载均衡 数据处理
MapReduce中的Combiner函数的作用和使用场景
MapReduce中的Combiner函数的作用和使用场景
654 0
|
弹性计算 缓存 应用服务中间件
阿里云服务器2核2G99元和2核4G199元实例规格性能及适用场景解析
2024年阿里云推出了两款云服务器,2核2G3M带宽40G ESSD Entry盘价格只要99元1年,2核4G5M带宽80G ESSD Entry盘价格只要199元1年,这两款云服务器的活动截止日期为2026年3月31日,活动期间新购、续费同价。那么这两款云服务器怎么样呢?可以用来做什么?本文将对这两款云服务器进行深度解析,包括配置介绍、实例规格、使用场景以及购买建议,以供选择参考。
阿里云服务器2核2G99元和2核4G199元实例规格性能及适用场景解析
|
缓存 监控 数据库
提高服务器响应速度是提升用户体验和系统性能的关键
提高服务器响应速度是提升用户体验和系统性能的关键
480 3
|
机器学习/深度学习 人工智能 算法
人工智能伦理:机器自主性的双刃剑
【7月更文挑战第18天】随着人工智能技术的飞速发展,机器的自主性日益增强。本文探讨了AI自主性带来的伦理挑战,包括责任归属问题、决策透明度与可解释性的需求,以及可能的社会影响。我们分析了在设计、部署和监管AI系统时必须考虑的关键伦理原则,并提出了一系列策略来确保技术进步不会损害人类价值。
600 4
STM32CubeMX ULN2003步进电机驱动
STM32CubeMX ULN2003步进电机驱动
500 0
|
机器学习/深度学习 存储 分布式计算
阿里开源首个DL框架,新型XDL帮你搞定大规模稀疏数据
12 月 21 日,阿里巴巴旗下的大数据营销平台阿里妈妈开源了其应用于自身广告业务的算法框架 X-Deep Learning(XDL)。该框架非常擅长处理高维稀疏数据,对构建推荐、搜索和广告系统非常有优势。此外,阿里还配套发布了一系列官方模型,它们都是阿里在实际业务或产品中采用的高效模型。
1871 0
阿里开源首个DL框架,新型XDL帮你搞定大规模稀疏数据
|
存储 区块链 数据安全/隐私保护
web3.0学习路径
Web3是指下一代互联网的演进形式,它涉及一系列技术和理念,旨在实现去中心化、开放、透明和用户主导的互联网体验。Web3的目标是赋予用户更多的控制权和数据所有权,并通过区块链、加密货币和分布式技术来实现。
492 2
|
图形学
【制作100个unity游戏之25】3D背包、库存、制作、快捷栏、存储系统、砍伐树木获取资源、随机战利品宝箱1(附带项目源码)
【制作100个unity游戏之25】3D背包、库存、制作、快捷栏、存储系统、砍伐树木获取资源、随机战利品宝箱1(附带项目源码)
526 0
|
存储 C语言
C语言程序设计——赋值表达式
C语言程序设计——赋值表达式

热门文章

最新文章