官方博客-第6页-阿里云开发者社区

望宸

2025-02-28

1344

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,344

恭常

2024-09-04

2685

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,685

阿里云云原生

2025-04-25

2115

MCP Server 实践之旅第 1 站：MCP 协议解析与云上适配

本文深入解析了Model Context Protocol（MCP）协议，探讨其在AI领域的应用与技术挑战。MCP作为AI协作的“USB-C接口”，通过标准化数据交互解决大模型潜力释放的关键瓶颈。文章详细分析了MCP的生命周期、传输方式（STDIO与SSE），并提出针对SSE协议不足的优化方案——MCP Proxy，实现从STDIO到SSE的无缝转换。同时，函数计算平台被推荐为MCP Server的理想运行时，因其具备自动弹性扩缩容、高安全性和按需计费等优势。最后，展望了MCP技术演进方向及对AI基础设施普及的推动作用，强调函数计算助力MCP大规模落地，加速行业创新。

阿里云云原生

2,115

德灵

2024-05-15

118267

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,267

米基

2024-05-15

4099

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,099

刘军

2024-10-17

3375

阿里云开源 AI 应用开发框架：Spring AI Alibaba

阿里云开源 Spring AI Alibaba，旨在帮助 Java 开发者快速构建 AI 应用，共同构建物理新世界。

刘军

3,375

夏冬

2025-04-01

3668

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

通过遵循以上最佳实践，可以构建一个高效、可靠的 RAG 系统，为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面，能够帮助开发者构建更好的 RAG 应用。

夏冬

3,668

澄潭计缘望宸

2025-03-14

1216

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,216

ModelScope

2025-05-23

1851

通义灵码 + 魔搭MCP：全流程构建创空间应用

最近，通义灵码上线 MCP（ModelScope Cloud Platform）功能，从之前代码生成及修改的基础功能，到可以使用MCP服务连接更多功能，开发者可以实现从代码爬取、模型推理到应用部署

ModelScope

1,851

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

大模型推理主战场：通信协议的标配

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

MCP Server 实践之旅第 1 站：MCP 协议解析与云上适配

阿里云PAI大模型RAG对话系统最佳实践

大模型推理优化实践：KV cache复用与投机采样

阿里云开源 AI 应用开发框架：Spring AI Alibaba

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义灵码 + 魔搭MCP：全流程构建创空间应用

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理主战场：通信协议的标配

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

MCP Server 实践之旅第 1 站：MCP 协议解析与云上适配

阿里云PAI大模型RAG对话系统最佳实践

大模型推理优化实践：KV cache复用与投机采样

阿里云开源 AI 应用开发框架：Spring AI Alibaba

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义灵码 + 魔搭MCP：全流程构建创空间应用