官方博客-第23页-阿里云开发者社区

亦达

2025-02-20

808

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

808

丕天

2025-03-21

1309

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,309

喻奎

2023-06-25

10684

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,684

阿里云云原生

2024-05-15

1007

阿里云 SAE 2.0 正式商用，极简易用、百毫秒弹性效率，降本 40%

本文主要介绍阿里云 Serverless 应用引擎如何帮助企业跨越技术鸿沟，从传统应用架构无感升级到 Serverless 架构，以更高效、更经济的方式进行转型，快速进入云原生快车道，让 2 人的研发团队享受 2000 人技术团队的红利。

阿里云云原生

1,007

刘宇

2024-05-15

112346

20行代码，Serverless架构下用Python轻松搞定图像分类和预测

本文将AI项目与Serverless架构进行结合，在Serverless架构下用20行Python代码搞定图像分类和预测。

刘宇

112,346

阿里云云原生

2024-08-12

568

5 大场景上手通义灵码企业知识库 RAG

大家好，我是通义灵码，你的智能编程助手！今天就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

568

黛忻赵世振

2024-09-23

1011

降本 60%！小熊油耗使用阿里云 SAE 更加稳定可靠

小熊油耗在进行架构升级时，进行了广泛的市场调研，深入分析了国内多家云服务商。经过对比多种 IaaS 层云主机方案及 Serverless 产品的部署策略，他们最终选择了阿里云Serverless 应用引擎 SAE。小熊油耗认为，阿里云能给他们提供更强的安全感，安全感来自于阿里云是一个更大的平台：历史最悠久，用户最多、产品最丰富、配套工具众多、技术支持体系成熟，阿里云 SAE，不仅在稳定性上表现卓越，在细粒度的成本控制和极致的弹性能力上表现也非常出色，而且免运维，完美契合了小熊油耗作为一家细分领域小而美的公司的需求。

黛忻赵世振

1,011

阿里云云原生

2024-10-23

714

Serverless + AI 让应用开发更简单

随着云计算和人工智能（AI）技术的飞速发展，企业对于高效、灵活且成本效益高的解决方案的需求日益增长。本文旨在探讨 Serverless 架构与 AI 技术的结合，如何通过 Serverless 函数计算和 AI 开发平台，助力企业简化应用开发流程，减少企业 AI 业务试错成本，加速业务创新，为企业业务发展提供无限可能。

阿里云云原生

714

阿里云云原生

2024-11-06

636

比 Copilot 快两倍以上，在我的开源项目 AI Godot 桌宠中用通义灵码解决问题

在我的开源项目 AI Godot 桌宠中用通义灵码解决问题。

阿里云云原生

636

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI 推理场景的痛点和解决方案

MaxCompute湖仓一体近实时增量处理技术架构揭秘

阿里云 SAE 2.0 正式商用，极简易用、百毫秒弹性效率，降本 40%

20行代码，Serverless架构下用Python轻松搞定图像分类和预测

5 大场景上手通义灵码企业知识库 RAG

降本 60%！小熊油耗使用阿里云 SAE 更加稳定可靠

Serverless + AI 让应用开发更简单

比 Copilot 快两倍以上，在我的开源项目 AI Godot 桌宠中用通义灵码解决问题

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI 推理场景的痛点和解决方案

MaxCompute湖仓一体近实时增量处理技术架构揭秘

阿里云 SAE 2.0 正式商用，极简易用、百毫秒弹性效率，降本 40%

20行代码，Serverless架构下用Python轻松搞定图像分类和预测

5 大场景上手通义灵码企业知识库 RAG

降本 60%！小熊油耗使用阿里云 SAE 更加稳定可靠

Serverless + AI 让应用开发更简单

比 Copilot 快两倍以上，在我的开源项目 AI Godot 桌宠中用通义灵码解决问题