官方博客-第6页-阿里云开发者社区

夏冬

2025-04-01

3674

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

通过遵循以上最佳实践，可以构建一个高效、可靠的 RAG 系统，为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面，能够帮助开发者构建更好的 RAG 应用。

夏冬

3,674

隆基

2024-05-15

143115

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

143,115

悦达

2025-03-21

1462

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,462

李德

2025-03-27

1437

大模型联网搜索的短板与突破之路

本文作者详细分析了当前大模型在联网搜索功能中存在的几个主要问题，并提供了具体的案例和解决方案。

李德

1,437

望宸

2025-02-28

1344

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,344

阿里云云原生

2024-09-25

1070

新场景、新能力，AI-native 时代的可观测革新

借助 AI-native 可观测解决方案，阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力，帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

阿里云云原生

1,070

坤硕

2024-07-29

20341

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

20,341

恭常

2024-09-04

2685

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,685

刘军

2024-10-17

3377

阿里云开源 AI 应用开发框架：Spring AI Alibaba

阿里云开源 Spring AI Alibaba，旨在帮助 Java 开发者快速构建 AI 应用，共同构建物理新世界。

刘军

3,377

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

监控vLLM等大模型推理性能

大模型联网搜索的短板与突破之路

大模型推理主战场：通信协议的标配

新场景、新能力，AI-native 时代的可观测革新

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

阿里云开源 AI 应用开发框架：Spring AI Alibaba

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

监控vLLM等大模型推理性能

大模型联网搜索的短板与突破之路

大模型推理主战场：通信协议的标配

新场景、新能力，AI-native 时代的可观测革新

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

阿里云开源 AI 应用开发框架：Spring AI Alibaba