官方博客-阿里云开发者社区

阿里云云原生

2024-05-15

2871

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,871

同涛

2024-09-03

7309

一文详解容器技术简介和基本原理

本文全面阐述了容器技术的发展历程、关键技术、架构和当前的行业生态，特别是容器技术在云环境中的应用和演进。

同涛

7,309

云服务器ECS

2023-10-17

2577

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

2,577

言澈

2025-02-28

1347

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,347

羽沐

2024-12-13

2107

动态链接的魔法：Linux下动态链接库机制探讨

本文将深入探讨Linux系统中的动态链接库机制，这其中包括但不限于全局符号介入、延迟绑定以及地址无关代码等内容。

羽沐

2,107

吴昆

2024-05-15

222200

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,200

子白

2024-05-15

102631

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,631

田双坤禹杨杨孙健翔

2024-05-15

101899

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,899

正己

2025-01-06

449

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

449

官方博客-阿里云开发者社区

类目筛选

内容类型

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

一文详解容器技术简介和基本原理

使用ECS部署并使用Docker

进行GPU算力管理

动态链接的魔法：Linux下动态链接库机制探讨

Kube Queue：Kubernetes 任务排队的利器

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

官方博客-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

一文详解容器技术简介和基本原理

使用ECS部署并使用Docker

进行GPU算力管理

动态链接的魔法：Linux下动态链接库机制探讨

Kube Queue：Kubernetes 任务排队的利器

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施