官方博客-第18页-阿里云开发者社区

亦达

2025-02-20

812

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

812

丕天

2025-03-21

1313

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,313

阿里云云原生

2025-05-23

657

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

657

阿里云云原生

2025-08-07

435

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

在 AI 与云原生融合的趋势下，开发者面临模型协同与云端扩展的挑战。MCP（模型上下文协议）提供统一的交互规范，简化模型集成与服务开发。Function AI 支持 MCP 代码一键上云，提供绑定代码仓库、OSS 上传、本地交付物部署及镜像部署等多种构建方式，助力开发者高效部署智能服务，实现快速迭代与云端协同。

阿里云云原生

435

一默

2024-08-26

423

打破传统叙事逻辑，构建基于原子化任务的人机交互

在复杂中后台设计中，为解决配置变更影响多场景问题，提出结合正向和逆向信息架构，采用原子化任务，动态组合任务，降低用户和开发成本，优化体验并改变已有的产品迭代和人机交互模式。未来可能发展为AI自动根据业务规则和用户行为生成最佳方案。

一默

423

阿里云云原生

2025-01-22

611

两步构建 AI 总结助手，实现智能文档摘要

本方案将运用函数计算 FC，构建一套高可用性的 Web 服务，以满足用户多样化的需求。当用户发起请求时，系统内部会自动将包含文本和提示词的信息传递给百炼模型服务，百炼平台将根据后台配置调用相应的大模型服务，对文本数据进行智能识别与解析，最终将总结结果返回给用户。

阿里云云原生

611

夏振华许文豪

2025-04-18

633

AI 时代，为什么编程能力≠ 开发门槛

在 2.0 阶段，我们目标是实现面向任务的协同编码模式，人的主要职责转变为任务的下发、干预以及最后结果的审查。在这个过程中，人的实际工作量开始减轻，AI 工作的占比显著提升。目前的 2.0 版本是我们最近上线的。

夏振华许文豪

633

应晖

2025-06-27

564

如何用通义灵码实现文本分析：以《红楼梦》人物出场统计为例

我们将分析一部红楼梦中关键角色出场次数前10位有哪些，并生成一个饼图。

应晖

564

周宇睿

2023-09-08

827

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新，围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

周宇睿

827

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI 推理场景的痛点和解决方案

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

打破传统叙事逻辑，构建基于原子化任务的人机交互

两步构建 AI 总结助手，实现智能文档摘要

AI 时代，为什么编程能力≠ 开发门槛

如何用通义灵码实现文本分析：以《红楼梦》人物出场统计为例

MaxCompute半结构化数据思考与创新

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI 推理场景的痛点和解决方案

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

打破传统叙事逻辑，构建基于原子化任务的人机交互

两步构建 AI 总结助手，实现智能文档摘要

AI 时代，为什么编程能力≠ 开发门槛

如何用通义灵码实现文本分析：以《红楼梦》人物出场统计为例

MaxCompute半结构化数据思考与创新