魔搭中文开源模型社区:模型即服务-大模型驱动的自然语言开放生态(中)

简介: 魔搭中文开源模型社区:模型即服务-

在多模态预测模型的基础上,用户可以针对于下游任务,做一些通用的开放域问答、电商域问答等等。

 

image.png

 

阿里云基于统一的模块化、多模态、大模型底座mPLUG,结合千亿级行业知识图谱的知识沉淀,采用层次化多任务预训练,构建了国内首个“知识交互”零售行业大模型,让商品“更懂”消费者和商家。

 

从技术层面来讲,阿里云结合通用数据、电商知识、多模态信息,进行层次化预训练。将千亿级零售知识注入行业大模型,让行业大模型反哺知识挖掘任务。除此之外,mPLUG模块化多模态的网络,统一支持NLP、多模态任务。

 

目前,mPLUG也已广泛应用于主搜、拍立淘、闲鱼、阿里妈妈、数字人、店小蜜等多个阿里电商核心场景,大幅提升业务效果。

 

image.png

 

除此之外,阿里云基于mPLUG通用底座,进一步对话任务预训练和微调,层次化赋能开放域对话,构建基于对话大模型的知识、情感、个性、记忆,四位一体的开放域对话大模型。

 

在知识方面,阿里云结合检索进行实时的知识储备,实现开放域知识对话。

 

在情感方面,阿里云希望模型具备有温度、共情的对话能力。能够让模型具有不同人设、自定义的对话风格。

 

在记忆方面,阿里云将通过长期记忆、短期记忆融合,让模型记住用户偏好,让回答更一致。

 

image.png

 

针对任务对话,阿里云构建了通义SPACE,主要针对任务流或特定任务,进行知识融入的预训练大模型。为此,阿里云提出了半监督模式,向预训练对话模型中注入人类标注知识,打造SPACE-1/2/3系列模型。

 

其中,SPACE-1融合了对话策略知识;SPACE-2融合了对话理解知识;SPACE-3集理解/策略/生成一体。基于SPACE的对话训练模型,不仅在国际对话榜单中多次取得第一,而且应用在阿里巴巴内部的场景。

 

image.png

 

接下来,讲一讲通义SPACE-T,主要面向多表多轮的表格预训练模型。用户可以用自然语言对表格进行查询,方便用户获取表格信息。基于表格训练模型,阿里云在表格问答的知名榜单上取得了第一,并发表了顶会论文。

相关文章
|
3月前
|
分布式计算 测试技术 Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
329 2
|
3月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1642 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
2月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
309 120
|
3月前
|
机器学习/深度学习 数据采集 人工智能
通义实验室Mobile-Agent-v3开源,全平台SOTA的GUI智能体,支持手机电脑等多平台交互
近日,通义实验室MobileAgent团队正式开源全新图形界面交互基础模型 GUI-Owl,并同步推出支持多智能体协同的自动化框架 Mobile-Agent-v3。该模型基于Qwen2.5-VL打造,在手机端与电脑端共8个GUI任务榜单中全面刷新开源模型性能纪录,达成全平台SOTA。
1046 2
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
迁移学习:让小数据也能驱动AI大模型
迁移学习:让小数据也能驱动AI大模型
334 99
|
3月前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
1677 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
3月前
|
云安全 人工智能 安全

相关产品

  • 自然语言处理