官方博客-第26页-阿里云开发者社区

亦达

2025-02-20

814

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

814

羽逸雨鸦

2025-03-06

1133

满血上阵，DeepSeek x 低代码创造专属知识空间

本文介绍了如何结合阿里云百炼和魔笔平台，快速构建一个智能化的专属知识空间。通过利用DeepSeek R1等先进推理模型，实现高效的知识管理和智能问答系统。 5. **未来扩展**：探讨多租户隔离、终端用户接入等高级功能，以适应更大规模的应用场景。通过这些步骤，用户可以轻松创建一个功能全面、性能卓越的知识管理系统，极大提升工作效率和创新能力。

羽逸雨鸦

1,133

阿里云云原生

2025-05-23

661

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

661

ModelScope

2025-06-16

699

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

699

阿里云云原生

2025-06-24

690

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

通义灵码现已全面支持Qwen3，新增智能体模式，具备自主决策、环境感知、工具使用等能力，可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换，结合MCP工具与记忆功能，提升开发效率。AI IDE重构编程流程，让开发更智能高效。

阿里云云原生

690

阿里云云原生

2024-05-15

843

百万并发，API 网关抗住了亚运会流量高峰

本文主要介绍作为亚运会所有核心流量的入口，阿里云推出了一款百万并发规格的 API 网关，抗住了亚运会流量高峰，为亚运会提供强大的技术支持。

阿里云云原生

843

隆基

2024-05-15

79548

深度剖析 RocketMQ 5.0，事件驱动：云时代的事件驱动有啥不同？

本文技术理念的层面了解一下事件驱动的概念。RocketMQ 5.0 在面向云时代的事件驱动架构新推出的子产品 EventBridge，最后再结合几个具体的案例帮助大家了解云时代的事件驱动方案。

隆基

79,548

项良十眠

2024-05-15

1204

无忧微服务：如何实现大流量下新版本的发布自由

本文讨论了微服务上云过程中的稳定性挑战，特别是变更引起的生产故障。阿里云MSE（微服务引擎）提供了一种全链路无损发布方案，旨在消除变更风险，实现白天流量高峰时的安全发布。

项良十眠

1,204

澄潭望宸

2024-07-22

1145

AI 时代，网关更能打了

随着互联网从 Web 2.0 迈进到 AI 时代，用户和互联网的交互方式，AI 时代下互联网的内容生产流程都发生了显著的转变，这对基础设施（Infra）提出了新的诉求，也带来了新的机遇。Infra 包含的内容非常丰富，本文仅从网关层面分享笔者的所见所感所悟。

澄潭望宸

1,145

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

满血上阵，DeepSeek x 低代码创造专属知识空间

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

百万并发，API 网关抗住了亚运会流量高峰

深度剖析 RocketMQ 5.0，事件驱动：云时代的事件驱动有啥不同？

无忧微服务：如何实现大流量下新版本的发布自由

AI 时代，网关更能打了

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

满血上阵，DeepSeek x 低代码创造专属知识空间

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

百万并发，API 网关抗住了亚运会流量高峰

深度剖析 RocketMQ 5.0，事件驱动：云时代的事件驱动有啥不同？

无忧微服务：如何实现大流量下新版本的发布自由

AI 时代，网关更能打了