官方博客-第20页-阿里云开发者社区

亦达

2025-02-20

810

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

810

羽逸雨鸦

2025-03-06

1129

满血上阵，DeepSeek x 低代码创造专属知识空间

本文介绍了如何结合阿里云百炼和魔笔平台，快速构建一个智能化的专属知识空间。通过利用DeepSeek R1等先进推理模型，实现高效的知识管理和智能问答系统。 5. **未来扩展**：探讨多租户隔离、终端用户接入等高级功能，以适应更大规模的应用场景。通过这些步骤，用户可以轻松创建一个功能全面、性能卓越的知识管理系统，极大提升工作效率和创新能力。

羽逸雨鸦

1,129

丕天

2025-03-21

1311

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,311

阿里云云原生

2025-06-03

763

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

本文介绍了如何使用通义灵码编程智能体与高德 MCP 2.0 制作北京端午3天旅行攻略页面。首先需下载通义灵码 AI IDE 并获取高德申请的 key，接着通过添加 MCP 服务生成 travel_tips.html 文件，最终在手机端查看已发布上线的攻略。此外还详细说明了利用通义灵码打造专属 MCP 服务的过程，包括开发计划、代码编写、部署及连接服务等步骤，并提供了自由探索的方向及相关资料链接。

阿里云云原生

763

阿里云云原生

2025-06-30

543

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

543

阿里云云原生

2024-05-15

478

实践总结｜前端架构设计的一点考究（下）

作者将【DDD、六边形、洋葱、清洁、CQRS】进行深入学习并梳理总结的一个前端架构设计，并且经历一定应用实践的考验。

阿里云云原生

478

景祁

2024-05-15

164590

设计与构建 FinOps 流程、团队、体系与目标

企业 FinOps 实施不是一蹴而就的项目，如果您正在推进企业云原生 FinOps 落地，除了选择合适的技术手段，企业内部的流程和体系建设也尤为重要。

景祁

164,590

刘军

2024-06-18

17071

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

本文展示了 Dubbo3 triple 协议是如何简化从协议规范与实现上简化开发测试、入口流量接入成本的，同时提供高性能通信、面向接口的易用性编码。

刘军

17,071

牛俊

2024-08-15

11829

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,829

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

满血上阵，DeepSeek x 低代码创造专属知识空间

AI 推理场景的痛点和解决方案

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

实践总结｜前端架构设计的一点考究（下）

设计与构建 FinOps 流程、团队、体系与目标

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

动手实践：高效构建企业级AI搜索

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

满血上阵，DeepSeek x 低代码创造专属知识空间

AI 推理场景的痛点和解决方案

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

实践总结｜前端架构设计的一点考究（下）

设计与构建 FinOps 流程、团队、体系与目标

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

动手实践：高效构建企业级AI搜索