官方博客-第37页-阿里云开发者社区

  • 2025-06-30
    543

    基于 AI 网关和 llmaz,提升 vLLM 推理服务可用性和部署易用性的实践

    本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务,并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力,构建稳定、高可用的大模型服务平台。

  • 2022-07-18
    445

    Dubbo3 StateRouter下一代高效流量路由机制

    目前 MSE 服务治理的 离群实例摘除、标签路由、金丝雀发布、全链路灰度等功能已经使用该路由方案,经过我们的压测与演练,在CPU、RT等方面均有不少提升,以 Demo 应用为例 (服务调用的跳数为2,下游30节点,每个节点1c2g) 其中调用 RT 提升约 6.7%。

    445
  • 2024-05-15
    423

    云消息队列 Kafka 版生态谈第一期:无代码转储能力介绍

    云消息队列 Kafka 版生态谈第一期:无代码转储能力介绍

    423
  • 2024-05-15
    109365

    深度剖析 RocketMQ 5.0,消息进阶:如何支撑复杂业务消息场景?

    本文主要学习 RocketMQ 的一致性特性,一致性对于交易、金融都是刚需。从大规模复杂业务出发,学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看,这里更多的是大型公司对于高阶可用性的要求,如同城容灾、异地多活等。

    109,365
  • 2024-05-15
    91546

    深度剖析 RocketMQ 5.0,IoT 消息:物联网需要什么样的消息技术?

    本文来学习一个典型的物联网技术架构,以及在这个技术架构里面,消息队列所发挥的作用。在物联网的场景里面,对消息技术的要求和面向服务端应用的消息技术有什么区别?学习 RocketMQ 5.0 的子产品 MQTT,是如何解决这些物联网技术难题的。

    91,546
  • 2024-05-15
    466

    阿里云可观测 2024 年 4 月产品动态

    阿里云可观测 2024 年 4 月产品动态。

  • 2024-07-04
    109560

    全链路追踪 & 性能监控,GO 应用可观测全面升级

    当前,大多数面向 Golang 应用的监控能力主要是通过 SDK 方式接入,需要开放人员手动进行埋点,会存在一定问题。对此,可观测 Go Agent 应运而生。本文介绍的阿里云可观测 Go Agent 方案,能通过无侵入的方式实现应用监控能力。

    109,560
  • 2024-09-06
    340

    高基数 GroupBy 在 SLS SQL 中的查询加速

    本文详细介绍了SLS中的高基数GroupBy查询加速技术。

    340
  • 2024-10-22
    462

    Python 应用可观测重磅上线:解决 LLM 应用落地的“最后一公里”问题

    为增强对 Python 应用,特别是 Python LLM 应用的可观测性,阿里云推出了 Python 探针,旨在解决 LLM 应用落地难、难落地等问题。助力企业落地 LLM。本文将从阿里云 Python 探针的接入步骤、产品能力、兼容性等方面展开介绍。并提供一个简单的 LLM 应用例子,方便测试。

    462
  • 1
    ...
    36
    37
    38
    ...
    45
    到第