官方博客-第26页-阿里云开发者社区

ModelScope

2024-05-15

1220

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,220

澄潭望宸

2024-07-22

1146

AI 时代，网关更能打了

随着互联网从 Web 2.0 迈进到 AI 时代，用户和互联网的交互方式，AI 时代下互联网的内容生产流程都发生了显著的转变，这对基础设施（Infra）提出了新的诉求，也带来了新的机遇。Infra 包含的内容非常丰富，本文仅从网关层面分享笔者的所见所感所悟。

澄潭望宸

1,146

阿里云云原生

2024-10-22

481

ApsaraMQ Serverless 能力再升级，事件驱动架构赋能 AI 应用

本文整理自2024年云栖大会阿里云智能集团高级技术专家金吉祥的演讲《ApsaraMQ Serverless 能力再升级，事件驱动架构赋能 AI 应用》。

阿里云云原生

481

青风古琦牧思如漫等

2024-11-21

452

为Go应用无侵入地添加任意代码

这篇文章旨在提供技术深度和实践指南，帮助开发者理解并应用这项创新技术来提高Golang应用的监控与服务治理能力。在接下来的部分，我们将通过一些实际案例，进一步展示如何在不同场景中应用这项技术，提供更多实践启示。

青风古琦牧思如漫等

452

阿里云云原生

2024-12-04

806

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

年会中的抽奖环节不可或缺，但每年为了选择合适的抽奖小程序，团队往往需要投入大量时间和精力。然而，抽奖结束后，参与者通常只记得自己是否中奖，其他细节多被遗忘。在 AI 技术日益成熟的今天，如何打造一个既高效又有技术含量的抽奖应用呢？今天，就让我们跟随通义灵码，仅用 5 分钟现场手撕一个抽奖应用吧！

阿里云云原生

806

楠瑆

2024-12-09

653

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

阿里云 ARMS 用户体验监控（RUM）推出了针对原生鸿蒙应用的 SDK。SDK 使用 ArkTS 语言开发，支持页面采集、资源加载采集、异常采集及自定义采集等功能，能够全面监控鸿蒙应用的表现。集成简单，只需几步即可将 SDK 接入项目中，为鸿蒙应用的开发者提供了强有力的支持。

楠瑆

653

舟谨

2024-12-13

614

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

614

涯海

2025-01-07

651

链路诊断最佳实践：1 分钟定位错慢根因

目前阿里云 ARMS 已经基于 LLM 大模型实现了单链路智能诊断，综合调用链、方法栈、异常堆栈、SQL、指标等多模态数据，结合链路诊断领域专家经验，有效识别单次请求的错慢根因，并给出相应的优化建议。

涯海

651

亦达

2025-02-20

814

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

814

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

AI 时代，网关更能打了

ApsaraMQ Serverless 能力再升级，事件驱动架构赋能 AI 应用

为Go应用无侵入地添加任意代码

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

如何提取手写票据信息

链路诊断最佳实践：1 分钟定位错慢根因

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

AI 时代，网关更能打了

ApsaraMQ Serverless 能力再升级，事件驱动架构赋能 AI 应用

为Go应用无侵入地添加任意代码

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

如何提取手写票据信息

链路诊断最佳实践：1 分钟定位错慢根因

破解 vLLM + DeepSeek 规模化部署的“不可能三角”