官方博客-第19页-阿里云开发者社区

ModelScope

2024-05-15

1220

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,220

阿里云云原生

2024-06-13

56164

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

区别于传统的流水线工具，本实验将带你体验云效应用交付平台 AppStack，从应用视角，完成一个 AI 聊天应用的高效交付。

阿里云云原生

56,164

子丑

2024-08-26

536

十六年所思所感，聊聊这些年我所经历的 DevOps 系统

从 2008 年开始，我陆陆续续参与了多个 DevOps 系统的建设，如今，审视这些系统的建设初衷和它们的设计思路或遇到的问题，依然有不少借鉴意义。我会按照时间顺序，把每个 DevOps 系统的特点，诞生的背景，以及在当时所主要解决的问题做一个概要的介绍，同时，我们也会以今天的视角再次审视这些问题，来看下同样的问题，经过十几年的发展，解决方案上有哪些不同。

子丑

536

明巍临城水德

2024-11-14

618

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

618

阿里云云原生

2024-11-26

767

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

在 Apache Dubbo 3.3.0 版本之后，官方推出了全新升级的 Triple X 协议，全面支持 HTTP/1、HTTP/2 和 HTTP/3 协议。本文将围绕 Triple 协议对 HTTP/3 的支持进行详细阐述，包括其设计目标、实际应用案例、性能测试结果以及源码架构分析等内容。

阿里云云原生

767

唐三望宸

2025-01-23

530

海外泼天流量｜浅谈全球化技术架构

本文对海外泼天流量现状做了快速整理，旨在抛砖引玉，促进国内企业在出海过程中，交流如何构建全球化技术架构的落地经验，相信会有越来越多资深人士分享更深层次的实践。

唐三望宸

530

亦达

2025-02-20

814

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

814

羽逸雨鸦

2025-03-06

1133

满血上阵，DeepSeek x 低代码创造专属知识空间

本文介绍了如何结合阿里云百炼和魔笔平台，快速构建一个智能化的专属知识空间。通过利用DeepSeek R1等先进推理模型，实现高效的知识管理和智能问答系统。 5. **未来扩展**：探讨多租户隔离、终端用户接入等高级功能，以适应更大规模的应用场景。通过这些步骤，用户可以轻松创建一个功能全面、性能卓越的知识管理系统，极大提升工作效率和创新能力。

羽逸雨鸦

1,133

阿里云云原生

2025-05-23

661

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

661

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

十六年所思所感，聊聊这些年我所经历的 DevOps 系统

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

海外泼天流量｜浅谈全球化技术架构

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

满血上阵，DeepSeek x 低代码创造专属知识空间

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

十六年所思所感，聊聊这些年我所经历的 DevOps 系统

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

海外泼天流量｜浅谈全球化技术架构

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

满血上阵，DeepSeek x 低代码创造专属知识空间

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理