官方博客-第6页-阿里云开发者社区

夏冬

2025-04-01

3673

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

通过遵循以上最佳实践，可以构建一个高效、可靠的 RAG 系统，为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面，能够帮助开发者构建更好的 RAG 应用。

夏冬

3,673

望宸

2025-02-28

1344

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,344

恭常

2024-09-04

2685

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,685

德灵

2024-05-15

118268

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,268

刘军

2024-10-17

3376

阿里云开源 AI 应用开发框架：Spring AI Alibaba

阿里云开源 Spring AI Alibaba，旨在帮助 Java 开发者快速构建 AI 应用，共同构建物理新世界。

刘军

3,376

元丹

2024-05-15

283099

深入浅出LangChain与智能Agent：构建下一代AI助手

LangChain为大型语言模型提供了一种全新的搭建和集成方式，通过这个强大的框架，我们可以将复杂的技术任务简化，让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。

元丹

283,099

米基

2024-05-15

4099

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,099

澄潭计缘望宸

2025-03-14

1216

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,216

ModelScope

2025-05-23

1851

通义灵码 + 魔搭MCP：全流程构建创空间应用

最近，通义灵码上线 MCP（ModelScope Cloud Platform）功能，从之前代码生成及修改的基础功能，到可以使用MCP服务连接更多功能，开发者可以实现从代码爬取、模型推理到应用部署

ModelScope

1,851

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

大模型推理主战场：通信协议的标配

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

阿里云PAI大模型RAG对话系统最佳实践

阿里云开源 AI 应用开发框架：Spring AI Alibaba

深入浅出LangChain与智能Agent：构建下一代AI助手

大模型推理优化实践：KV cache复用与投机采样

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义灵码 + 魔搭MCP：全流程构建创空间应用

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

大模型推理主战场：通信协议的标配

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

阿里云PAI大模型RAG对话系统最佳实践

阿里云开源 AI 应用开发框架：Spring AI Alibaba

深入浅出LangChain与智能Agent：构建下一代AI助手

大模型推理优化实践：KV cache复用与投机采样

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义灵码 + 魔搭MCP：全流程构建创空间应用