官方博客-第23页-阿里云开发者社区

亦达

2025-02-20

810

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

810

羽逸雨鸦

2025-03-06

1129

满血上阵，DeepSeek x 低代码创造专属知识空间

本文介绍了如何结合阿里云百炼和魔笔平台，快速构建一个智能化的专属知识空间。通过利用DeepSeek R1等先进推理模型，实现高效的知识管理和智能问答系统。 5. **未来扩展**：探讨多租户隔离、终端用户接入等高级功能，以适应更大规模的应用场景。通过这些步骤，用户可以轻松创建一个功能全面、性能卓越的知识管理系统，极大提升工作效率和创新能力。

羽逸雨鸦

1,129

阿里云云原生

2025-06-03

763

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

本文介绍了如何使用通义灵码编程智能体与高德 MCP 2.0 制作北京端午3天旅行攻略页面。首先需下载通义灵码 AI IDE 并获取高德申请的 key，接着通过添加 MCP 服务生成 travel_tips.html 文件，最终在手机端查看已发布上线的攻略。此外还详细说明了利用通义灵码打造专属 MCP 服务的过程，包括开发计划、代码编写、部署及连接服务等步骤，并提供了自由探索的方向及相关资料链接。

阿里云云原生

763

阿里云云原生

2025-06-30

543

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

543

星铱

2023-10-19

54180

PolarDB-X 企业级特性之行级访问权限控制

本文介绍PolarDB-X数据库实现了基于标签的访问控制功能，可以在行、列级别对数据访问进行控制，精细化的限制用户对数据的访问和操作，保证了读写数据的安全。下文根据实际应用场景，介绍PolarDB-X的LBAC功能设计以及使用方法。

星铱

54,180

寒亭

2024-05-15

842

一次访问Redis延时高问题排查与总结

作者抽丝剥茧的记录了一次访问Redis延时高问题的排查和总结。

寒亭

842

ModelScope

2024-05-15

110155

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,155

阿里云瑶池数据库

2024-05-15

71511

数据存储成本飙升，莫慌，RDS数据归档功能来了

一文解锁阿里云RDS数据归档功能。

阿里云瑶池数据库

71,511

牛俊

2024-08-15

11829

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,829

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

满血上阵，DeepSeek x 低代码创造专属知识空间

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

PolarDB-X 企业级特性之行级访问权限控制

一次访问Redis延时高问题排查与总结

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

数据存储成本飙升，莫慌，RDS数据归档功能来了

动手实践：高效构建企业级AI搜索

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

满血上阵，DeepSeek x 低代码创造专属知识空间

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

PolarDB-X 企业级特性之行级访问权限控制

一次访问Redis延时高问题排查与总结

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

数据存储成本飙升，莫慌，RDS数据归档功能来了

动手实践：高效构建企业级AI搜索