官方博客-第20页-阿里云开发者社区

亦达

2025-02-20

810

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

810

羽逸雨鸦

2025-03-06

1129

满血上阵，DeepSeek x 低代码创造专属知识空间

本文介绍了如何结合阿里云百炼和魔笔平台，快速构建一个智能化的专属知识空间。通过利用DeepSeek R1等先进推理模型，实现高效的知识管理和智能问答系统。 5. **未来扩展**：探讨多租户隔离、终端用户接入等高级功能，以适应更大规模的应用场景。通过这些步骤，用户可以轻松创建一个功能全面、性能卓越的知识管理系统，极大提升工作效率和创新能力。

羽逸雨鸦

1,129

阿里云云原生

2025-06-03

763

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

本文介绍了如何使用通义灵码编程智能体与高德 MCP 2.0 制作北京端午3天旅行攻略页面。首先需下载通义灵码 AI IDE 并获取高德申请的 key，接着通过添加 MCP 服务生成 travel_tips.html 文件，最终在手机端查看已发布上线的攻略。此外还详细说明了利用通义灵码打造专属 MCP 服务的过程，包括开发计划、代码编写、部署及连接服务等步骤，并提供了自由探索的方向及相关资料链接。

阿里云云原生

763

阿里云云原生

2025-06-30

543

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

543

ModelScope

2024-05-15

110155

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,155

牛俊

2024-08-15

11829

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,829

阿里云云原生

2024-09-14

567

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

本⽂对敏感信息拦截插件的使用方式和实现原理进行了简单介绍，它能够自动检测并处理请求和响应中的敏感词，有效防止敏感信息泄露。通过对不同数据范围的支持和灵活的配置选项，该插件能够适应各种应用场景，确保数据的安全性和合规性。

阿里云云原生

567

李德

2025-04-03

484

结合多模态RAG和异步调用实现大模型内容

文章探讨了如何利用多模态大模型和工程优化手段提升物流理赔业务效率。核心方案包括：通过多模态RAG技术实现图片查重，结合异步调用方法优化货损识别功能。

李德

484

阿里云云原生

2025-05-16

770

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

为了展现 LoongCollector 的卓越性能，本文通过纵向（LoongCollector 与 iLogtail 产品升级对比）和横向（LoongCollector 与其他开源日志采集 Agent 对比）两方面对比，深度测评不同采集 Agent 在常见的日志采集场景下的性能。

阿里云云原生

770

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

满血上阵，DeepSeek x 低代码创造专属知识空间

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

动手实践：高效构建企业级AI搜索

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

结合多模态RAG和异步调用实现大模型内容

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

满血上阵，DeepSeek x 低代码创造专属知识空间

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

动手实践：高效构建企业级AI搜索

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

结合多模态RAG和异步调用实现大模型内容

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评