动态 | AI能看懂英文,阿里巴巴夺实体发现测评全球第一

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: AI科技评论消息,全球顶级的知识库构建测评KBP2017日期公布了最新排名。阿里巴巴人工智能研究机构iDST斩获英文实体发现测评全球冠军,在准确率和召回率上均表现出色,核心指标F1达到0.811。这次测评吸引了全球20多支顶尖团队参与,包括IBM Research, BBN, Stanford Univ, CMU Univ, UIUC Univ, Columbia Univ, 腾讯等。

AI科技评论消息,全球顶级的知识库构建测评KBP2017日期公布了最新排名。阿里巴巴人工智能研究机构iDST斩获英文实体发现测评全球冠军,在准确率和召回率上均表现出色,核心指标F1达到0.811。这次测评吸引了全球20多支顶尖团队参与,包括IBM Research, BBN, Stanford Univ, CMU Univ, UIUC Univ, Columbia Univ, 腾讯等。

KBP是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院)指导、美国国防部协办的赛事,主要任务为从自然书写的非结构化文本中抽取实体,以及实体之间的关系。

dec1f8d329dd51ebe7c599d274520b52e22dee8f

这项测评要求AI算法在“读完”一篇英文文章后,构建一个物理世界的命名实体和实体之间关系的知识库,如“克林顿和希拉里之间是夫妻关系”、“克林顿毕业于耶鲁法学院”这样一个个实体的关系。

阿里巴巴iDST自然语言处理首席科学家司罗介绍,他们的算法可以做到对文章上下文的理解。比如,文章出现了Apple,再出现Jobs,就可以辨别出这个Jobs指的是乔布斯,而不是工作。再比如,文章出现了Microsoft,那么Apple就更有可能是苹果公司,而不是一种水果。

“另外,我们构建了一个算法去学习不同领域之间共同的部分,通过迁移学习提升我们学习的准确度。对于不同领域数据,我们取其精华,去其糟粕,进行智能学习”,司罗说。

在这次测评中,iDST团队采用经过改良的深度神经网络架构对文本进行理解。改良的架构有三个主要特点:首先该模型可以自动阅读海量文章(如维基百科)并从中汲取经验;其次,该架构可以智能选择训练数据集以保证训练数据的准确性;最后,我们采用post regularization的办法保证模型结果的一致性。

对于KBP2017的成绩,司罗表示:“很荣幸能够同全球的同行分享阿里巴巴的研究成果,人工智能在机器阅读理解和知识库构建上还处在起步阶段,我们正在积极和同行业顶尖机构学习交流,推动行业发展。比如我们内部建设的信息抽取平台AliIE项目就在同斯坦福大学展开积极合作”。

阿里巴巴正在将这样的信息抽取技术广泛的应用到实际业务当中,并致力于让更多的中小开发者从中收益。他们搭建的信息抽取平台AliIE拥有最顶尖的AI技术,并从一开始的架构设计就考虑到平台的开放性和可扩展性。可以让更多的开发者、研究员共同开发,并将成果回馈给这个社区。

2d14508710a34ff89580f0fca3c6ed6a2ab5849b

阿里巴巴iDST自然语言处理首席科学家司罗

司罗是全球权威机器智能学者,曾担任美国普渡大学计算机系终身教授,主持的20余个项目得到美国政府、工业界资助,先后获得美国国家科学基金会成就奖、雅虎、谷歌研究奖等。

由他领导的自然语言处理团队目前支持了阿里巴巴大生态每天多达600亿次的自然语言处理需求,团队横跨杭州、北京、硅谷、西雅图(新加坡)多地,成员大多拥有10年以上的研发经验。检索招聘网站可以看到,他们依旧在不断扩充团队。

相关文章
|
2月前
|
数据采集 人工智能 监控
体验《AI大模型助力客户对话分析》解决方案测评
该方案详细描述了实现AI客服对话分析的实践原理和实施方法,包括数据收集、模型训练、部署及评估等步骤,逻辑清晰。但在OSS配置和模型选择等方面存在一些困惑,需进一步引导。示例代码大部分可直接应用,但特定环境下需调整。总体而言,方案基本能满足实际业务需求,但在处理复杂对话时需进一步优化。
75 0
|
2天前
|
人工智能 自然语言处理 搜索推荐
主动式智能导购AI助手构建解决方案测评
主动式智能导购AI助手构建解决方案测评
119 81
|
2月前
|
数据采集 机器学习/深度学习 人工智能
《AI大模型助力客户对话分析》解决方案测评
本文对《AI大模型助力客户对话分析》解决方案进行了测评,详细介绍了实践原理和实施方法的清晰度、部署过程中的困惑、示例代码的适用性和异常处理以及业务场景的适用性和改进建议。方案整体实用性强,但在数据预处理、术语解释和行业特定模型训练方面有进一步提升的空间。
|
1天前
|
人工智能 安全 数据安全/隐私保护
文档智能 & RAG让AI大模型更懂业务测评
文档智能 & RAG让AI大模型更懂业务
102 73
|
2天前
|
存储 人工智能 Serverless
方案测评 | 10分钟上手主动式智能导购AI助手构建
本文介绍了一种基于Multi-Agent架构的智能导购系统方案,利用百炼的Assistant API快速构建,旨在10分钟内完成搭建并实现精准的商品推荐。通过详细的操作指南,展示了从获取API Key、创建函数计算应用、部署示例网站、验证导购效果到集成商品检索应用等全过程,最后提出了关于文档完善、功能优化等方面的体验反馈。
|
9天前
|
人工智能 监控 Serverless
《主动式智能导购AI助手构建》解决方案部署测评
在数字化时代,智能导购AI助手已成为提升客户体验和销售效率的重要工具。本文将基于个人体验,对《主动式智能导购AI助手构建》解决方案的部署过程进行详细评测。
28 3
|
21天前
|
人工智能 自然语言处理 Serverless
方案测评 | AI大模型助力客户音频对话分析
该方案利用阿里云的函数计算、对象存储及智能对话分析技术,实现客户对话的自动化分析,精准识别客户意图,评估服务互动质量,提供数据驱动的决策支持。其特点包括智能化分析、数据驱动决策、低成本、自动化处理、精准识别、实时反馈及成本效益。方案适用于提升企业服务质量与客户体验,尤其在处理海量客户对话数据时表现突出。
|
21天前
|
人工智能 自然语言处理 算法
《文档智能 & RAG让AI大模型更懂业务》解决方案的测评:
此解决方案通过文档智能技术分析、处理和结构化业务文档,利用RAG技术整合至LLM知识库,提升AI模型的业务理解和响应准确性。部署文档详尽易懂,适合新手操作。系统在专业领域查询中表现出色,但建议优化冷启动性能和多语言处理能力,以满足更多企业需求。适用于客户服务、内部知识管理和数据分析等场景,特别适合需高效信息检索的大型企业,建议提供不同规模解决方案以适应各类企业。
46 1
|
29天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
93 4
|
1月前
|
数据采集 人工智能 自然语言处理
《文档智能 & RAG让AI大模型更懂业务》解决方案测评
《文档智能 & RAG让AI大模型更懂业务》解决方案测评