官方博客-阿里云开发者社区

阿里云云原生

2024-05-15

2875

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,875

同涛

2024-09-03

7310

一文详解容器技术简介和基本原理

本文全面阐述了容器技术的发展历程、关键技术、架构和当前的行业生态，特别是容器技术在云环境中的应用和演进。

同涛

7,310

吴昆

2024-05-15

222201

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,201

田双坤禹杨杨孙健翔

2024-05-15

101900

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,900

无哲

2024-08-13

13371

更快更强，SLS 推出高性能 SPL 日志查询模式

从海量的日志数据中，按照各种灵活的条件进行即时查询搜索，是可观测场景下的基本需求。本文介绍了 SLS 新推出的高性能 SPL 日志查询模式，支持 Unix 风格级联管道式语法，以及各种丰富的 SQL 处理函数。同时通过计算下推、向量化计算等优化，使得 SPL 查询可以在数秒内处理亿级数据，并支持 SPL 过滤结果分布图、随机翻页等特性。

无哲

13,371

张佐玮

2023-12-01

1688

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,688

子白

2024-05-15

102632

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,632

探索云世界

2024-12-20

1059

本文介绍了对象存储（OSS）在AI业务中的应用与实践。内容涵盖四个方面：1) 对象存储作为AI数据基石，因其低成本和高弹性成为云上数据存储首选；2) AI场景下的对象存储实践方案，包括数据获取、预处理、训练及推理阶段的具体使用方法；3) 国内主要区域的默认吞吐量提升至100Gbps，优化了大数据量下的带宽需求；4) 常用工具介绍，如OSSutil、ossfs、Python SDK等，帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施，以及不同工具的特点和应用场景。

探索云世界

1,059

阿里云云原生

2024-05-15

136212

云原生场景下，AIGC 模型服务的工程挑战和应对

本文介绍了在云原生场景下，AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。

阿里云云原生

136,212

官方博客-阿里云开发者社区

类目筛选

内容类型

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

一文详解容器技术简介和基本原理

Kube Queue：Kubernetes 任务排队的利器

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

更快更强，SLS 推出高性能 SPL 日志查询模式

Koordinator 助力云原生应用性能提升，小红书混部技术实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

AI场景下的对象存储OSS数据管理实践

云原生场景下，AIGC 模型服务的工程挑战和应对

官方博客-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

一文详解容器技术简介和基本原理

Kube Queue：Kubernetes 任务排队的利器

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

更快更强，SLS 推出高性能 SPL 日志查询模式

Koordinator 助力云原生应用性能提升，小红书混部技术实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

AI场景下的对象存储OSS数据管理实践

云原生场景下，AIGC 模型服务的工程挑战和应对