自然语言处理-推荐-第4页-阿里云开发者社区-阿里云

蚝油菜花

|

10月前

|

人工智能测试技术

|

博文

LIMO：上海交大推出高效推理方法，仅需817条训练样本就能激活大语言模型的复杂推理能力

LIMO 是由上海交通大学推出的一种高效推理方法，通过极少量的高质量训练样本激活大语言模型的复杂推理能力。

431 11 11

蚝油菜花

|

11月前

|

人工智能 JSON 测试技术

|

博文

Search-o1：人大清华联合推出动态检索推理框架，使模型能够在推理过程中动态检索外部知识

Search-o1 是中国人民大学和清华大学联合推出的创新框架，通过动态知识检索和精炼，提升大型推理模型在复杂任务中的推理能力。

481 23 24

蚝油菜花

|

11月前

|

人工智能自然语言处理数据库

|

博文

CHRONOS：阿里通义联合上海交大推出时间线摘要生成框架，适用于大规模新闻数据的时间线生成任务

CHRONOS 是由阿里通义实验室与上海交大联合推出的时间线摘要生成框架，支持开放域与封闭域，通过迭代自问自答机制生成连贯的时间线摘要，适用于新闻、金融、教育等多个领域。

611 15 15

蚝油菜花

|

11月前

|

人工智能 Python

|

博文

ImBD：复旦联合华南理工推出 AI 内容检测模型，快速辨别文本内容是否为 AI 生成

ImBD是一款由复旦大学、华南理工大学等机构联合推出的AI内容检测器，能够快速识别机器修订文本，适用于多种场景，显著提升检测性能。

820 8 8

蚝油菜花

|

8月前

|

人工智能 IDE API

|

博文

白板秒变IDE，草图直接生成可运行代码！Pad.ws：白板+代码编辑器深度结合，创意到实现无缝衔接

Pad.ws是一款创新的在线开发环境，将交互式白板与完整IDE工具深度结合，支持多人实时协作和多种编程语言，无需安装即可通过浏览器访问。

420 1 1

蚝油菜花

|

8月前

|

机器学习/深度学习人工智能数据可视化

|

博文

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

GLM-Z1-Rumination是智谱推出的新一代沉思模型，通过扩展强化学习训练实现长程推理能力，支持动态工具调用与自我验证机制，显著提升AI自主研究能力。

399 13 14

蚝油菜花

|

10月前

|

人工智能缓存并行计算

|

博文

FlashMLA：DeepSeek最新开源！MLA解码内核让NVIDIA Hopper开启性能狂暴模式，推理速度飙升至3000GB/s

FlashMLA 是 DeepSeek 开源的高效 MLA 解码内核，专为 NVIDIA Hopper 架构 GPU 优化，支持 BF16 精度和页式 KV 缓存，适用于大语言模型推理和自然语言处理任务。

388 2 2

蚝油菜花

|

10月前

|

人工智能自然语言处理架构师

|

博文

Praison AI：LangChain危险了！这个低代码框架让AI智能体「自主协作」，1行代码搞定任务编排

Praison AI 是一个开源的多智能体框架，支持低代码创建和管理AI代理，提供多种流程类型和集成选项，适用于企业流程自动化、智能客服等场景。

455 18 18

蚝油菜花

|

10月前

|

机器学习/深度学习人工智能算法

|

博文

o3-mini：OpenAI 发布最新推理模型，强大的STEM推理能力，灵活调整推理强度

OpenAI o3-mini是OpenAI推出的全新推理模型，专为科学、数学和编程等技术领域优化，支持三种推理强度，灵活调整性能。

629 25 25

蚝油菜花

|

11月前

|

人工智能自然语言处理测试技术

|

博文

WebWalker：阿里巴巴推出评估LLMs在网页浏览任务中性能的基准工具

WebWalker是阿里巴巴开发的用于评估大型语言模型在网页浏览任务中性能的工具，支持多智能体框架和垂直探索策略，提供WebWalkerQA数据集进行性能测试。

526 1 2

蚝油菜花

|

11月前

|

人工智能自然语言处理调度

|

博文

Casevo：开源的社会传播模拟系统，基于 AI 模拟人类认知、决策和社会交互，预测社会传播现象

Casevo 是中国传媒大学推出的开源社会传播模拟系统，结合大语言模型和多智能体技术，支持复杂社会网络建模与动态交互，适用于新闻传播、社会计算等领域。

460 22 22

蚝油菜花

|

11月前

|

人工智能 API 数据库

|

博文

Cognita：小白也能搭建 RAG 系统，提供交互界面的开源模块化 RAG 框架，支持多种文档检索技术

Cognita 是一个面向生产环境的开源模块化 RAG 框架，支持本地部署、无代码 UI 和增量索引，帮助开发者轻松构建和扩展生产级应用。

598 11 11

蚂蚁百宝箱

|

1月前

|

人工智能自然语言处理资源调度

|

博文

蚂蚁百宝箱“一箱搞定”会展智能，「桐小乌」为乌镇互联网大会提供全天候一站式向导服务

2025世界互联网大会·乌镇峰会圆满落幕，蚂蚁百宝箱依托智能体开发平台，快速打造会展专属智能体“桐小乌”，实现会前、会中、会后全链路智能化服务。通过“碰一下”打卡、AR导览、智能问答等功能，提升参会体验；基于行业模板与零代码能力，助力展会高效运营，推动智能会展“一箱搞定”。

134 9 9

蚝油菜花

|

8月前

|

机器学习/深度学习人工智能 IDE

|

博文

14B小模型代码成绩紧逼O3-Mini！DeepCoder-14B-Preview：基于Deepseek-R1蒸馏优化的开源代码生成模型

DeepCoder-14B-Preview是基于Deepseek-R1蒸馏优化的140亿参数模型，通过强化学习微调在LiveCodeBench达到60.6%准确率，开源训练数据与系统优化方案。

431 3 3

蚝油菜花

|

10月前

|

数据采集人工智能监控

|

博文

Crawl4LLM：你的模型还在吃垃圾数据？CMU博士开源AI爬虫，自动筛选高价值网页，数据抓取质量飙升300%

Crawl4LLM 是清华大学和卡内基梅隆大学联合开发的智能爬虫系统，通过网页价值评估和优先级队列技术，显著提升大语言模型预训练数据采集效率。

539 4 5

蚝油菜花

|

12月前

|

存储人工智能开发框架

|

博文

Kheish：开源的多智能体开发框架，通过 YAML 配置工作流和多个 Agent 共同协作解决复杂任务

Kheish 是一个开源的多智能体协调平台，基于大型语言模型（LLM）设计，能够通过灵活配置多个智能体来解决复杂任务。平台支持模块化集成、聊天式提示、反馈循环等功能，适用于代码审计、法律文件分析、客户服务自动化等多种应用场景。

391 18 18

22r2esrjmupyy

|

9月前

|

问答

您好，我在使用ModelScope的训练服务的时候，总是出现这个异常，请问这是什么问题？

167 0 0

游客pklednr3ea35k

|

11月前

|

Python 人工智能

|

问答

Unichat - qwen2.5 - 32B - c1 模型已经下载下来在运行python报错

233 1 0

ZhangCraig

|

1月前

|

人工智能前端开发关系型数据库

|

博文

MajorRAG 概述（1/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法

125 1 1

kntulkscg2mn4

|

6月前

|

Swift 物联网 Shell

|

问答

请问如何使用ms-swift工具验证模型微调的效果？

265 0 0

蚝油菜花

|

8月前

|

人工智能自然语言处理测试技术

|

博文

能够双向推理的LLM！Dream-7B：港大联合华为开源的扩散推理模型，能够同时考虑前后文信息

Dream-7B是由香港大学与华为诺亚方舟实验室联合研发的开源扩散大语言模型，采用独特的掩码扩散范式，在文本生成、数学推理和代码编写等任务中展现出卓越性能。

372 3 3

蚝油菜花

|

10月前

|

机器学习/深度学习存储人工智能

|

博文

Satori：快速体验MIT与哈佛推出7B参数的推理专家模型，具备自回归搜索和自我纠错能力

Satori 是由 MIT 和哈佛大学等机构联合推出的 7B 参数大型语言模型，专注于提升推理能力，具备强大的自回归搜索和自我纠错功能。

256 5 5

robotliu0327_nwhel

|

1月前

|

索引 API

|

问答

embedding模型部署调用出现接口调用不一致

119 0 0

蚝油菜花

|

8月前

|

机器学习/深度学习人工智能前端开发

|

博文

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

Meta最新开源的SWEET-RL框架通过优化多轮交互任务的信用分配机制，使Llama-3.1-8B模型在协作推理任务中的表现提升6%，性能达到顶尖大模型水平。

444 33 33

蚝油菜花

|

9月前

|

人工智能边缘计算自然语言处理

|

博文

DistilQwen2.5-R1：蒸馏黑科技！32B推理能力塞进3B小模型，推理速度狂飙300%

阿里巴巴最新发布的DistilQwen2.5-R1系列模型通过知识蒸馏技术，在保持高性能的同时大幅降低计算资源需求，7B模型性能甚至可媲美32B大模型。

310 11 11

蚝油菜花

|

9月前

|

人工智能自然语言处理数据可视化

|

博文

autoMate：无需视觉模型！用DeepSeek-V3/R1就能实现自动化操作电脑，支持任何可视化界面

autoMate是一款基于AI和RPA的本地自动化工具，通过自然语言实现复杂任务的自动化操作，支持本地部署，确保数据安全和隐私，适合需要高效处理重复性工作的用户。

619 1 1

1809979304209485

|

11月前

|

自然语言处理 Swift 人工智能

|

问答

llamaindex整合modelscope本地模型，启动报错

499 1 0

蚝油菜花

|

9月前

|

人工智能自然语言处理

|

博文

TxGemma：谷歌DeepMind革命药物研发！270亿参数AI药理学家24小时在线

谷歌推出专为药物研发设计的TxGemma大模型，具备药物特性预测、生物文献筛选、多步推理等核心能力，提供20亿至270亿参数版本，显著提升治疗开发效率。

320 7 7

robet

|

1月前

|

问答

请检查下这个嵌入式模型， Qwen/Qwen3-Embedding-8B

128 0 0

cryrobot

|

5月前

|

问答

funasr微调问题，训练paraformer模型的时候，text的标注文本是否需要加上标点符号

121 0 0

XiaoPenYou

|

8月前

|

机器学习/深度学习算法 NoSQL

|

博文

记录转大模型—InitCommit

嗯，写点东西记录一下转大模型的经历。

180 14 14

蚝油菜花

|

9月前

|

人工智能自然语言处理 PyTorch

|

博文

Instella：AMD开源30亿参数语言模型！训练效率碾压同级选手

Instella是AMD推出的30亿参数开源语言模型，基于自回归Transformer架构，支持多轮对话、指令跟随和自然语言理解，适用于智能客服、内容创作和教育辅导等多个领域。

198 1 1

蚝油菜花

|

9月前

|

人工智能缓存自然语言处理

|

博文

TokenSwift：90分钟生成10万Token！文本生成提速3倍，无损加速黑科技

TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架，能在90分钟内生成10万Token的文本，速度提升3倍，生成质量无损，支持多种模型架构。

292 16 16

蚝油菜花

|

10月前

|

机器学习/深度学习人工智能 API

|

博文

Aligner：自动修正AI的生成结果，北大推出残差修正模型对齐技术

介绍北大团队提出的 Aligner 模型对齐技术，通过学习对齐答案与未对齐答案之间的修正残差，提升大语言模型的性能。

432 28 28

游客y2etiigytptbm

|

6月前

|

Java Spring 人工智能

|

问答

关于MCP在业务场景的使用，如何让大模型懂得业务逻辑，可以按照业务逻辑调用多个tools来完成对话。

336 0 0

1507395097940844

|

11月前

|

Python 开发工具 git

|

问答

魔搭平台FastChat搭建Qwen-1_8B模型报错求怎么解决？

264 1 0

pklim101

|

5月前

|

编解码

|

问答

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

151 0 0

游客pw4uyj7ukrvgo

|

7月前

|

容器 Docker

|

问答

FunASR docker部署后，服务崩掉自动重启时，还是会下载模型

317 0 0

蚝油菜花

|

11月前

|

存储人工智能 JSON

|

博文

RAG Logger：专为检索增强生成(RAG)应用设计的开源日志工具，支持查询跟踪、性能监控

RAG Logger 是一款专为检索增强生成（RAG）应用设计的开源日志工具，支持查询跟踪、检索结果记录、LLM 交互记录和性能监控等功能。

476 7 7

蚝油菜花

|

12月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

Granite 3.1：IBM 开源新一代可商用大语言模型，支持 128K 上下文长度、多语言和复杂任务处理

IBM 推出的 Granite 3.1 是一款新一代语言模型，具备强大的性能和更长的上下文处理能力，支持多语言和复杂任务处理。

562 0 0

游客zfcooaevjenbu

|

12月前

|

问答

微调llama3时报modelscope - ERROR错，能帮忙看一下什么问题吗

234 1 0

游客qv34insecrx5c

|

4月前

|

问答

C-MTEB评估qwen模型

139 0 0

蚝油菜花

|

8月前

|

机器学习/深度学习人工智能决策智能

|

博文

推理速度开挂！谷歌推出 Gemini 2.5 Flash：在保持Gemini 2.5精度的同时，延迟降低到竞品的1/3

谷歌最新推出的Gemini 2.5 Flash AI模型在保持低延迟和成本效益的同时，通过引入思考能力为开发者解锁了智能代理构建、代码辅助等新应用场景。

378 1 1

游客pkday7jizkisy

|

9月前

|

问答

微调大模型的tokenize_function编写求教

184 0 0

蚝油菜花

|

11月前

|

存储人工智能图计算

|

博文

MiniRAG：迷你 RAG 系统加成小型语言模型，爆发出与大型语言模型相当的性能

MiniRAG 是香港大学推出的新型 RAG 系统，专为资源受限场景设计，支持高效知识检索与推理，适用于多种应用场景。

536 12 13

黄小贵2021

|

12月前

|

自然语言处理

|

问答

简单的基于LLM的RAG程序，对问题的回答不符合逻辑，请问是哪里出了问题？

150 1 0

aliyun4664677311-39277

|

12月前

|

API 人工智能

|

问答

使用魔搭社区的创空间建立了一个APP后，想通过API访问该APP，总是报错。

512 1 0

自然语言处理

最新

文章

视频

问答

推荐

精华

LIMO：上海交大推出高效推理方法，仅需817条训练样本就能激活大语言模型的复杂推理能力

Search-o1：人大清华联合推出动态检索推理框架，使模型能够在推理过程中动态检索外部知识

CHRONOS：阿里通义联合上海交大推出时间线摘要生成框架，适用于大规模新闻数据的时间线生成任务

ImBD：复旦联合华南理工推出 AI 内容检测模型，快速辨别文本内容是否为 AI 生成

白板秒变IDE，草图直接生成可运行代码！Pad.ws：白板+代码编辑器深度结合，创意到实现无缝衔接

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

FlashMLA：DeepSeek最新开源！MLA解码内核让NVIDIA Hopper开启性能狂暴模式，推理速度飙升至3000GB/s

Praison AI：LangChain危险了！这个低代码框架让AI智能体「自主协作」，1行代码搞定任务编排

o3-mini：OpenAI 发布最新推理模型，强大的STEM推理能力，灵活调整推理强度

WebWalker：阿里巴巴推出评估LLMs在网页浏览任务中性能的基准工具

Casevo：开源的社会传播模拟系统，基于 AI 模拟人类认知、决策和社会交互，预测社会传播现象

Cognita：小白也能搭建 RAG 系统，提供交互界面的开源模块化 RAG 框架，支持多种文档检索技术

蚂蚁百宝箱“一箱搞定”会展智能，「桐小乌」为乌镇互联网大会提供全天候一站式向导服务

14B小模型代码成绩紧逼O3-Mini！DeepCoder-14B-Preview：基于Deepseek-R1蒸馏优化的开源代码生成模型

Crawl4LLM：你的模型还在吃垃圾数据？CMU博士开源AI爬虫，自动筛选高价值网页，数据抓取质量飙升300%

Kheish：开源的多智能体开发框架，通过 YAML 配置工作流和多个 Agent 共同协作解决复杂任务

您好，我在使用ModelScope的训练服务的时候，总是出现这个异常，请问这是什么问题？

Unichat - qwen2.5 - 32B - c1 模型已经下载下来 在运行python报错

MajorRAG 概述（1/3）

请问如何使用ms-swift工具验证模型微调的效果？

能够双向推理的LLM！Dream-7B：港大联合华为开源的扩散推理模型，能够同时考虑前后文信息

Satori：快速体验MIT与哈佛推出7B参数的推理专家模型，具备自回归搜索和自我纠错能力

embedding模型部署调用出现接口调用不一致

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

DistilQwen2.5-R1：蒸馏黑科技！32B推理能力塞进3B小模型，推理速度狂飙300%

autoMate：无需视觉模型！用DeepSeek-V3/R1就能实现自动化操作电脑，支持任何可视化界面

llamaindex整合modelscope本地模型，启动报错

TxGemma：谷歌DeepMind革命药物研发！270亿参数AI药理学家24小时在线

请检查下这个嵌入式模型， Qwen/Qwen3-Embedding-8B

funasr微调问题，训练paraformer模型的时候，text的标注文本是否需要加上标点符号

记录转大模型—InitCommit

Instella：AMD开源30亿参数语言模型！训练效率碾压同级选手

TokenSwift：90分钟生成10万Token！文本生成提速3倍，无损加速黑科技

Aligner：自动修正AI的生成结果，北大推出残差修正模型对齐技术

关于MCP在业务场景的使用，如何让大模型懂得业务逻辑，可以按照业务逻辑调用多个tools来完成对话。

魔搭平台FastChat搭建Qwen-1_8B模型报错 求怎么解决？

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

FunASR docker部署后，服务崩掉自动重启时，还是会下载模型

RAG Logger：专为检索增强生成(RAG)应用设计的开源日志工具，支持查询跟踪、性能监控

Granite 3.1：IBM 开源新一代可商用大语言模型，支持 128K 上下文长度、多语言和复杂任务处理

微调llama3时报modelscope - ERROR错，能帮忙看一下什么问题吗

C-MTEB评估qwen模型

推理速度开挂！谷歌推出 Gemini 2.5 Flash：在保持Gemini 2.5精度的同时，延迟降低到竞品的1/3

微调大模型的tokenize_function编写求教

MiniRAG：迷你 RAG 系统加成小型语言模型，爆发出与大型语言模型相当的性能

简单的基于LLM的RAG程序，对问题的回答不符合逻辑，请问是哪里出了问题？

使用魔搭社区的创空间建立了一个APP后，想通过API访问该APP，总是报错。

活跃用户

相关产品

Unichat - qwen2.5 - 32B - c1 模型已经下载下来在运行python报错

魔搭平台FastChat搭建Qwen-1_8B模型报错求怎么解决？