官方博客-第25页-阿里云开发者社区

ModelScope

2024-05-15

1221

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,221

澄潭望宸

2024-07-22

1147

AI 时代，网关更能打了

随着互联网从 Web 2.0 迈进到 AI 时代，用户和互联网的交互方式，AI 时代下互联网的内容生产流程都发生了显著的转变，这对基础设施（Infra）提出了新的诉求，也带来了新的机遇。Infra 包含的内容非常丰富，本文仅从网关层面分享笔者的所见所感所悟。

澄潭望宸

1,147

钰诚

2024-08-12

677

使用 Higress 快速构建 AI 应用

Higress 基于企业内外的丰富场景沉淀了众多面向 AI 的功能，推出了 AI 原生的 API 网关形态并且全部开源。

钰诚

677

阿里云云原生

2024-08-26

723

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

本⽂对 Prompt 的使用方式进行了简单介绍，让大家了解到 Prompt 对于 LLM 的重要性。并尝试在 Prompt 中结合用户 Geo IP 信息，实现 LLM 的个性化回复，提升问答的准确度。

阿里云云原生

723

重彦

2024-09-25

775

深入探索 RUM 与全链路追踪：优化数字体验的利器

本文主要介绍了基于 OpenTeletemetry 与 W3C 协议构建端到端全链路的解决方案，同时探讨了 RUM 与端到端链路集成的最佳实践，希望可以为大家在生产环境落地应用提供一些参考。

重彦

775

明巍临城水德

2024-11-14

619

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

619

古琦

2024-12-27

1028

编译时插桩，Go应用监控的最佳选择

本文讲解了阿里云编译器团队和可观测团队为了实现Go应用监控选择编译时插桩的原因，同时还介绍了其他的监控方案以及它们的优缺点。

古琦

1,028

涯海

2025-01-17

820

链路诊断最佳实践：1 分钟定位错慢根因

本文聚焦于线上应用的风险管理，特别是针对“错”（程序运行不符合预期）和“慢”（性能低下或响应迟缓）两大类问题，提出了一个系统化的根因诊断方案。

涯海

820

柯灵

2025-03-11

1670

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,670

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

AI 时代，网关更能打了

使用 Higress 快速构建 AI 应用

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

深入探索 RUM 与全链路追踪：优化数字体验的利器

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

编译时插桩，Go应用监控的最佳选择

链路诊断最佳实践：1 分钟定位错慢根因

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

AI 时代，网关更能打了

使用 Higress 快速构建 AI 应用

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

深入探索 RUM 与全链路追踪：优化数字体验的利器

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

编译时插桩，Go应用监控的最佳选择

链路诊断最佳实践：1 分钟定位错慢根因

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理