官方博客-第26页-阿里云开发者社区

阿里云云原生

2025-06-30

543

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

543

云技术达人

2025-08-14

374

Dubbo 云原生重构出击：更快部署、更强控制台、更智能运维

Apache Dubbo 最新升级支持云原生，提供一键部署微服务集群与全新可视化控制台，提升全生命周期管理体验，助力企业高效构建云原生应用。

云技术达人

374

屈岳

2023-12-01

62702

SLS支持高精度时间戳和全局排序

日志内容本身是一种重要信息，日志之间的相对顺序也是因果关系的一种反映，某些场景下如果日志内容完全相同，但是日志间的顺序错乱了反映出来的结果可能和真实世界里面的事件完全相反。

屈岳

62,702

ModelScope

2024-05-15

110155

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,155

牛俊

2024-08-15

11829

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,829

浅奕

2024-09-05

462

通过实验深入了解 TCP 连接的建立和关闭

TCP/IP 这个主题很多文章比较陈旧，且以讹传讹的东西太多，所以本文作者结合了理论和实践去写，旨在通过一系列实验帮助读者深入理解 TCP 连接的建立过程。

浅奕

462

寻剑

2024-09-11

426

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

426

阿里云云原生

2024-09-14

567

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

本⽂对敏感信息拦截插件的使用方式和实现原理进行了简单介绍，它能够自动检测并处理请求和响应中的敏感词，有效防止敏感信息泄露。通过对不同数据范围的支持和灵活的配置选项，该插件能够适应各种应用场景，确保数据的安全性和合规性。

阿里云云原生

567

阿里云云原生

2024-12-17

924

10 分钟打造你的专属 AI 客服

在这个数字化时代，提供卓越的客户服务已成为企业脱颖而出的关键。为了满足这一需求，越来越多的企业开始探索人工智能（AI）助手的应用，以实现全天候（7x24）的客户咨询响应，全面提升用户体验和业务竞争力。本解决方案通过函数计算FC 和大模型服务平台百炼，为您提供一个高效便捷构建 AI 助手思路。

阿里云云原生

924

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Dubbo 云原生重构出击：更快部署、更强控制台、更智能运维

SLS支持高精度时间戳和全局排序

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

动手实践：高效构建企业级AI搜索

通过实验深入了解 TCP 连接的建立和关闭

表格存储低成本向量检索服务助力 AI 检索

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

10 分钟打造你的专属 AI 客服

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Dubbo 云原生重构出击：更快部署、更强控制台、更智能运维

SLS支持高精度时间戳和全局排序

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

动手实践：高效构建企业级AI搜索

通过实验深入了解 TCP 连接的建立和关闭

表格存储低成本向量检索服务助力 AI 检索

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

10 分钟打造你的专属 AI 客服