官方博客-阿里云开发者社区

同涛

2024-09-03

7295

一文详解容器技术简介和基本原理

本文全面阐述了容器技术的发展历程、关键技术、架构和当前的行业生态，特别是容器技术在云环境中的应用和演进。

同涛

7,295

阿里云云原生

2024-05-15

2852

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,852

云服务器ECS

2023-10-17

2558

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

2,558

宝惜

2024-11-15

644

架构师的真内核

本文旨在帮助大家深入理解技术、架构和团队领导力的本质，从而获得持续成长的方法。欢迎在文末留言，你觉得架构师需要具备的核心能力是什么？

宝惜

644

阿里云云原生

2024-11-26

763

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

在 Apache Dubbo 3.3.0 版本之后，官方推出了全新升级的 Triple X 协议，全面支持 HTTP/1、HTTP/2 和 HTTP/3 协议。本文将围绕 Triple 协议对 HTTP/3 的支持进行详细阐述，包括其设计目标、实际应用案例、性能测试结果以及源码架构分析等内容。

阿里云云原生

763

言澈

2025-02-28

1335

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,335

骆天

2024-05-15

3971

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

3,971

子白

2024-05-15

102623

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,623

吴昆

2024-05-15

222193

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,193

官方博客-阿里云开发者社区

类目筛选

内容类型

一文详解容器技术简介和基本原理

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

使用ECS部署并使用Docker

架构师的真内核

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

进行GPU算力管理

高并发架构设计三大利器：缓存、限流和降级

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

官方博客-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

一文详解容器技术简介和基本原理

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

使用ECS部署并使用Docker

架构师的真内核

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

进行GPU算力管理

高并发架构设计三大利器：缓存、限流和降级

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器