官方博客-第6页-阿里云开发者社区

阿里云开发者

2025-04-24

2301

MCP 实践：基于 MCP 架构实现知识库答疑系统

文章探讨了AI Agent的发展趋势，并通过一个实际案例展示了如何基于MCP（Model Context Protocol）开发一个支持私有知识库的问答系统。

阿里云开发者

2,301

子潍

2025-05-22

1747

本文介绍了通过MCP（Model Context Protocol）结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型，配合ComfyUI生成图像，并通过小红书等社交媒体发布内容，展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server，完成从本地文件读取到生成图像再到发布的全流程。方案优势在于高可扩展性和易用性，但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战，推动MCP在更多领域落地。

子潍

1,747

ModelScope

2025-05-23

1851

通义灵码 + 魔搭MCP：全流程构建创空间应用

最近，通义灵码上线 MCP（ModelScope Cloud Platform）功能，从之前代码生成及修改的基础功能，到可以使用MCP服务连接更多功能，开发者可以实现从代码爬取、模型推理到应用部署

ModelScope

1,851

恭常

2024-09-04

2685

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,685

米基

2024-05-15

4097

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,097

唐殊

2024-11-01

2338

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

唐殊

2,338

望宸

2025-02-28

1344

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,344

杨永

2024-05-15

94037

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

94,037

德灵

2024-05-15

118267

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,267

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

MCP 实践：基于 MCP 架构实现知识库答疑系统

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

通义灵码 + 魔搭MCP：全流程构建创空间应用

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

大模型推理优化实践：KV cache复用与投机采样

探索LLM推理全阶段的JSON格式输出限制方法

大模型推理主战场：通信协议的标配

使用KMS为MSE-Nacos敏感配置加密的最佳实践

阿里云PAI大模型RAG对话系统最佳实践

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

MCP 实践：基于 MCP 架构实现知识库答疑系统

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

通义灵码 + 魔搭MCP：全流程构建创空间应用

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

大模型推理优化实践：KV cache复用与投机采样

探索LLM推理全阶段的JSON格式输出限制方法

大模型推理主战场：通信协议的标配

使用KMS为MSE-Nacos敏感配置加密的最佳实践

阿里云PAI大模型RAG对话系统最佳实践