官方博客-第2页-阿里云开发者社区

阿里云云原生

2025-01-10

609

Qwen2.5 的云端新体验，5 分钟完成极速部署

将 Qwen2.5 模型部署于函数计算 FC，用户能依据业务需求调整资源配置，有效应对高并发场景，并通过优化资源配置，如调整实例规格、多 GPU 部署和模型量化来提升推理速度。此外，函数计算支持多样化 GPU 计费模式（按需计费、阶梯定价、极速模式），可根据业务需求调整，在面对高频请求和大规模数据处理时，能够显著降低综合成本。

阿里云云原生

609

寒斜

2024-06-24

36717

文章介绍了GPT-Sovits，一个开源的生成式语音模型，因其在声音克隆上的高质量和简易性而受到关注。阿里云函数计算（Function Compute）提供了一个快速托管GPT-Sovits的方法，让用户无需管理服务器即可体验和部署该模型。通过函数计算，用户可以便捷地搭建基于GPT-Sovits的文本到语音服务，并享受到按需付费和弹性扩展的云服务优势。此外，文章还列举了GPT-Sovits在教育、游戏、新能源等多个领域的应用场景，并提供了详细的步骤指导，帮助用户在阿里云上部署和体验GPT-Sovits模型。

寒斜

36,717

阿里云云原生

645

全球首个搭载 Kimi-K2 的 Serverless 架构 VibeCoding解决方案重磅来袭！

本文介绍了基于阿里云 Function AI 和 Serverless 架构的 AI 编程解决方案 VibeCoding，展示其如何通过 AI 快速开发并上线小游戏及平台。方案支持普通与专家两种模式，用户可选择不同模型与数据库配置，具备良好的扩展性与交互体验，适合开发者与企业快速实现创意落地。

阿里云云原生

645

田双坤禹杨杨孙健翔

2024-05-15

101903

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,903

有松

2025-01-16

483

AI 场景下，函数计算 GPU 实例模型存储最佳实践

当前，函数计算 FC 已被广泛应用在各种 AI 场景下，函数计算支持通过使用容器镜像部署 AI 推理应用，并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用，并快速解决不同场景下的模型存储选型问题，本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析，以期为您的模型存储决策提供帮助。

有松

483

子白

2024-05-15

102633

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,633

无哲

2024-08-13

13371

更快更强，SLS 推出高性能 SPL 日志查询模式

从海量的日志数据中，按照各种灵活的条件进行即时查询搜索，是可观测场景下的基本需求。本文介绍了 SLS 新推出的高性能 SPL 日志查询模式，支持 Unix 风格级联管道式语法，以及各种丰富的 SQL 处理函数。同时通过计算下推、向量化计算等优化，使得 SPL 查询可以在数秒内处理亿级数据，并支持 SPL 过滤结果分布图、随机翻页等特性。

无哲

13,371

探索云世界

2024-12-20

1060

AI场景下的对象存储OSS数据管理实践

本文介绍了对象存储（OSS）在AI业务中的应用与实践。内容涵盖四个方面：1) 对象存储作为AI数据基石，因其低成本和高弹性成为云上数据存储首选；2) AI场景下的对象存储实践方案，包括数据获取、预处理、训练及推理阶段的具体使用方法；3) 国内主要区域的默认吞吐量提升至100Gbps，优化了大数据量下的带宽需求；4) 常用工具介绍，如OSSutil、ossfs、Python SDK等，帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施，以及不同工具的特点和应用场景。

探索云世界

1,060

张佐玮

2023-12-01

1688

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,688

官方博客-第2页-阿里云开发者社区

类目筛选

内容类型

Qwen2.5 的云端新体验，5 分钟完成极速部署

AI 克隆声音，只需 3 分钟（附最全教程）

全球首个搭载 Kimi-K2 的 Serverless 架构 VibeCoding解决方案重磅来袭！

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

AI 场景下，函数计算 GPU 实例模型存储最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

更快更强，SLS 推出高性能 SPL 日志查询模式

AI场景下的对象存储OSS数据管理实践

Koordinator 助力云原生应用性能提升，小红书混部技术实践

官方博客-第2页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Qwen2.5 的云端新体验，5 分钟完成极速部署

AI 克隆声音，只需 3 分钟（附最全教程）

全球首个搭载 Kimi-K2 的 Serverless 架构 VibeCoding解决方案重磅来袭！

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

AI 场景下，函数计算 GPU 实例模型存储最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

更快更强，SLS 推出高性能 SPL 日志查询模式

AI场景下的对象存储OSS数据管理实践

Koordinator 助力云原生应用性能提升，小红书混部技术实践