官方博客-第2页-阿里云开发者社区

子白

2024-05-15

102631

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,631

阿里云云原生

2024-05-15

136210

云原生场景下，AIGC 模型服务的工程挑战和应对

本文介绍了在云原生场景下，AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。

阿里云云原生

136,210

探索云世界

2024-05-15

40762

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

幻兽帕鲁最近非常火。有些小伙伴可能不喜欢跟陌生人一起玩，那么你可以搭建一个专有服务器和朋友一起联机游戏。自己搭建服务器不仅更私密，还能自定义游戏里的一些选项，比如调整工作速度倍率、经验获取倍率等。这篇教程将引导你在几分钟内快速完成幻兽帕鲁服务器的搭建。

探索云世界

40,762

匡大虎

2024-05-15

1644

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论，深度解析企业云原生 DevSecOps 体系构建。

匡大虎

1,644

李鹏

2024-05-15

769

Serverless Kubernetes 开发实践：异构资源，按需使用

Kubernetes 作为当今云原生业界标准，具备良好的生态以及跨云厂商能力。Kubernetes 很好的抽象了 IaaS 资源交付标准，使得云资源交付变的越来越简单，与此同时用户期望更多的聚焦于业务自身，做到面向应用交付，Serverless 理念也因此而生。那么如何通过原生 k8s 提供Serverless 能力？如何实现GPU等异构资源按需使用？这里给大家介绍一下我们在Serverless Kubernetes 开发实践：异构资源，按需使用。

李鹏

769

正己

2025-01-06

449

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

449

阿里云云原生

2025-05-06

940

通过 MCP 构建企业级数据分析 Agent

本文介绍了使用阿里云实时数仓 Hologres、函数计算 FC 和通义大模型 Qwen3 构建企业级数据分析 Agent 的方法。通过 MCP（模型上下文协议）标准化接口，解决大模型与外部工具和数据源集成的难题。Hologres 提供高性能数据分析能力，支持实时数据接入和湖仓一体分析；函数计算 FC 提供弹性、安全的 Serverless 运行环境；Qwen3 具备强大的多语言处理和推理能力。方案结合 ModelScope 的 MCP Playground，实现高效的服务化部署，帮助企业快速构建跨数据源、多步骤分解的数据分析 Agent，优化数据分析流程并降低成本。

阿里云云原生

940

刘佳旭

2023-09-26

139150

云原生场景下高可用架构的最佳实践

刘佳旭

139,150

张佐玮

2023-12-01

1682

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,682

官方博客-第2页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

云原生场景下，AIGC 模型服务的工程挑战和应对

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

Serverless Kubernetes 开发实践：异构资源，按需使用

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

通过 MCP 构建企业级数据分析 Agent

云原生场景下高可用架构的最佳实践

Koordinator 助力云原生应用性能提升，小红书混部技术实践

官方博客-第2页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

云原生场景下，AIGC 模型服务的工程挑战和应对

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

Serverless Kubernetes 开发实践：异构资源，按需使用

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

通过 MCP 构建企业级数据分析 Agent

云原生场景下高可用架构的最佳实践

Koordinator 助力云原生应用性能提升，小红书混部技术实践