官方博客-第2页-阿里云开发者社区

  • 2025-02-07
    1199

    浏览量超 10w 的热图,描述 RAG 的主流架构

    大模型性能的持续提升,进一步挖掘了 RAG 的潜力,RAG 将检索系统与生成模型相结合,带来诸多优势,如实时更新知识、降低成本等。点击本文,为您梳理 RAG 的基本信息,并介绍提升大模型生成结果的方法,快一起看看吧~

    1,199
  • 2025-03-21
    1462

    监控vLLM等大模型推理性能

    本文将深入探讨 AI 推理应用的可观测方案,并基于 Prometheus 规范提供一套完整的指标观测方案,帮助开发者构建稳定、高效的推理应用。

    1,462
  • 2025-04-01
    3673

    RAG 调优指南:Spring AI Alibaba 模块化 RAG 原理与使用

    通过遵循以上最佳实践,可以构建一个高效、可靠的 RAG 系统,为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面,能够帮助开发者构建更好的 RAG 应用。

    3,673
  • 2025-04-25
    2118

    MCP Server 实践之旅第 1 站:MCP 协议解析与云上适配

    本文深入解析了Model Context Protocol(MCP)协议,探讨其在AI领域的应用与技术挑战。MCP作为AI协作的“USB-C接口”,通过标准化数据交互解决大模型潜力释放的关键瓶颈。文章详细分析了MCP的生命周期、传输方式(STDIO与SSE),并提出针对SSE协议不足的优化方案——MCP Proxy,实现从STDIO到SSE的无缝转换。同时,函数计算平台被推荐为MCP Server的理想运行时,因其具备自动弹性扩缩容、高安全性和按需计费等优势。最后,展望了MCP技术演进方向及对AI基础设施普及的推动作用,强调函数计算助力MCP大规模落地,加速行业创新。

  • 2024-09-25
    1070

    新场景、新能力,AI-native 时代的可观测革新

    借助 AI-native 可观测解决方案,阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力,帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

  • 2024-05-15
    143112

    深度剖析 RocketMQ 5.0,架构解析:云原生架构如何支撑多元化场景?

    了解 RocketMQ 5.0 的核心概念和架构概览;然后我们会从集群角度出发,从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互;学习 RocketMQ 如何实现数据的存储,数据的高可用,如何利用云原生存储进一步提升竞争力。

    143,112
  • 2024-07-29
    20340

    LLM 应用可观测性:从 Trace 视角展开的探索与实践之旅

    基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点,本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战,近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践,一起来了解下吧。

    20,340
  • 2025-01-24
    2126

    DeepSeek-R1 来了,从 OpenAI 平滑迁移到 DeepSeek的方法

    Higress 作为一款开源的 AI 网关工具,可以提供基于灰度+观测的平滑迁移方案。

    2,126
  • 2024-05-15
    93898

    当 OpenTelemetry 遇上阿里云 Prometheus

    本文以构建系统可观测为切入点,对比 OpenTelemetry 与 Prometheus 的相同与差异,重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

  • 1
    2
    3
    4
    ...
    31
    到第
    2/31