官方博客-第36页-阿里云开发者社区

亦达

2025-02-20

805

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

805

是溪诚全南也

2025-02-28

1029

1分钟集成DeepSeek满血版！搭建智能运维助手

阿里云 AI 搜索开放平台面向企业及开发者提供丰富的组件化AI搜索服务，本文将重点介绍基于AI搜索开放平台内置的 DeepSeek-R1 系列大模型，如何搭建 Elasticsearch AI Assistant。

是溪诚全南也等

1,029

泓逸

2025-04-07

419

不断突破极致：SPL新版数据加工能力焕新登场

SPL 算子不仅完成了旧版 DSL 加工向更强大语法和算子形式的过渡，更将性能调优和场景适配做到了极致，解锁了时序预测和日志分析的更多可能性。作为重要的基础设施模块，SPL 加工能力将持续优化演进。未来的规划将继续聚焦通用性、性能与产品能力，为用户提供更加强大、灵活的技术支持。

泓逸

419

资源编排ROS

2019-12-23

1902

资源编排ROS之自定制资源（多云部署AWS篇）

资源编排服务（Resource Orchestration Service，简称ROS）是阿里云提供的一项简化云计算资源管理的服务。您可以遵循ROS定义的模板规范编写资源栈模板，在模板中定义所需的云计算资源（例如ECS实例、RDS数据库实例）、资源间的依赖关系等。

资源编排ROS

1,902

涯客十眠

2023-08-04

965

Sentinel 2.0 微服务零信任的探索与实践

涯客十眠

965

阿里云中间件

2023-08-25

559

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

阿里云中间件

559

娜米

2024-05-15

422

云消息队列 Kafka 版生态谈第一期：无代码转储能力介绍

娜米

422

之卫

2024-05-15

631

Nacos 在云原生架构下的演进

之卫

631

资源编排ROS

2024-05-15

291

通过计算巢轻松部署Salt服务

Salt基于Python构建，是一个事件驱动的自动化工具和框架，用于部署、配置和管理复杂的IT系统。使用Salt来自动化公共基础设施管理任务，并确保基础设施的所有组件都以一致的期望状态运行。本文向您介绍如何开通计算巢上的Salt服务，以及部署流程和使用说明。

资源编排ROS

291

官方博客-第36页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

1分钟集成DeepSeek满血版！搭建智能运维助手

不断突破极致：SPL新版数据加工能力焕新登场

资源编排ROS之自定制资源（多云部署AWS篇）

Sentinel 2.0 微服务零信任的探索与实践

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

云消息队列 Kafka 版生态谈第一期：无代码转储能力介绍

Nacos 在云原生架构下的演进

通过计算巢轻松部署Salt服务

官方博客-第36页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

1分钟集成DeepSeek满血版！搭建智能运维助手

不断突破极致：SPL新版数据加工能力焕新登场

资源编排ROS之自定制资源（多云部署AWS篇）

Sentinel 2.0 微服务零信任的探索与实践

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

云消息队列 Kafka 版生态谈第一期：无代码转储能力介绍

Nacos 在云原生架构下的演进

通过计算巢轻松部署Salt服务