异构计算的搜索结果_文章_第20页-阿里云开发者社区

sysin

|

2月前

|

博文

VMware ESXi 9.0.1.0 发布 - 领先的裸机 Hypervisor

# 存储 # 虚拟化 # 异构计算 # Windows # 内存技术

aliyun9170107523-43660

|

2月前

|

博文

|

来自： ModelScope模型即服务

142_故障容错：冗余与回滚机制 - 配置多副本的独特健康检查

在大语言模型（LLM）的生产环境部署中，系统的可靠性和稳定性至关重要。随着LLM应用场景的不断扩展，从简单的文本生成到复杂的多模态交互，用户对服务可用性和响应质量的要求也日益提高。据2025年最新的AI服务可用性报告显示，顶级AI服务提供商的SLA（服务级别协议）承诺已达到99.99%，这意味着每年的计划外停机时间不得超过52.56分钟。

# 运维 # 监控 # 异构计算 # 容器 # Perl

aliyun9170107523-43660

|

2月前

|

博文

|

来自： ModelScope模型即服务

119_LLM训练的高效内存管理与优化技术：从ZeRO到Flash Attention

大型语言模型（LLM）的训练面临着前所未有的计算和内存挑战。随着模型规模达到数百亿甚至数千亿参数，高效的内存管理成为训练成功的关键因素之一。2025年，LLM训练的内存优化技术已经取得了显著进展，从ZeRO优化器到Flash Attention等创新技术，为训练超大规模模型提供了可能。

# 存储 # 机器学习/深度学习 # PyTorch # 异构计算 # 内存技术

aliyun9170107523-43660

|

2月前

|

博文

|

来自： ModelScope模型即服务

118_LLM模型量化与压缩：从理论到2025年实践技术详解

大型语言模型（LLM）在自然语言处理领域取得了前所未有的成功，但模型规模的快速增长带来了巨大的计算和存储挑战。一个典型的大型语言模型（如GPT-4或LLaMA 3）可能包含数千亿甚至万亿参数，需要数百GB甚至TB级的存储空间，并且在推理时需要大量的计算资源。这种规模使得这些模型难以在边缘设备、移动设备甚至资源有限的云服务器上部署和使用。

# 机器学习/深度学习 # PyTorch # 算法框架/工具 # 异构计算 # AI芯片

aliyun9170107523-43660

|

2月前

|

博文

|

来自： ModelScope模型即服务

109_噪声鲁棒微调：对抗训练

在当今大语言模型（LLM）的广泛应用中，模型的鲁棒性问题日益凸显。对抗性攻击通过在输入中添加微小但精心设计的扰动，能够误导模型产生错误输出，这对依赖LLM的关键系统构成了严重威胁。噪声鲁棒微调作为提升模型抵抗对抗攻击能力的重要技术，正成为大模型安全性研究的核心方向之一。

# 存储 # 自然语言处理 # 算法 # 调度 # 异构计算

aliyun9170107523-43660

|

2月前

|

博文

|

来自： ModelScope模型即服务

138_绿色计算：碳排放优化 - 估算部署的碳足迹与LLM环境友好型部署最佳实践

随着大语言模型(LLM)在各个行业的广泛应用，其计算需求和环境影响正日益受到关注。根据最新研究，训练一个大型LLM模型可能产生数百吨二氧化碳当量的排放，这相当于普通家庭几十年的碳足迹。在全球气候变化和可持续发展的背景下，如何优化LLM部署的碳足迹，实现环境友好型AI应用，已成为行业面临的重要挑战。

# 存储 # 人工智能 # 数据中心 # 异构计算 # Python

aliyun9170107523-43660

|

2月前

|

博文

|

来自： ModelScope模型即服务

139_剪枝优化：稀疏模型压缩 - 分析结构化剪枝的独特速度提升与LLM部署加速实践

随着大语言模型(LLM)规模的不断增长，模型参数量已从最初的数亿扩展到数千亿甚至万亿级别。这种规模的模型在推理过程中面临着巨大的计算和内存挑战，即使在最先进的硬件上也难以高效部署。剪枝优化作为一种有效的模型压缩技术，通过移除冗余或不重要的参数，在保持模型性能的同时显著减少计算资源需求。

# 机器学习/深度学习 # 缓存 # 监控 # 算法 # 异构计算

aliyun9170107523-43660

|

2月前

|

博文

|

来自： ModelScope模型即服务

140_异步推理：队列管理框架 - 使用Celery处理高并发请求的独特设计

在大型语言模型(LLM)部署的实际场景中，推理服务的并发处理能力直接影响用户体验和系统稳定性。随着LLM应用的普及，如何高效处理大量并发请求成为部署优化中的关键挑战。传统的同步请求处理方式在面对突发流量时容易导致系统过载，响应延迟增加，甚至服务崩溃。异步推理通过引入队列管理机制，能够有效缓冲请求峰值，平滑系统负载，提高资源利用率，从而为LLM服务提供更稳定、更高效的并发处理能力。

# 存储 # 监控 # NoSQL # Redis # 异构计算

aliyun9170107523-43660

|

2月前

|

博文

|

来自： ModelScope模型即服务

117_LLM训练的高效分布式策略：从数据并行到ZeRO优化

在2025年，大型语言模型（LLM）的规模已经达到了数千亿甚至数万亿参数，训练这样的庞然大物需要先进的分布式训练技术支持。本文将深入探讨LLM训练中的高效分布式策略，从基础的数据并行到最先进的ZeRO优化技术，为读者提供全面且实用的技术指南。

# 存储 # 监控 # 算法 # PyTorch # 异构计算

aliyun9170107523-43660

|

2月前

|

博文

|

来自： ModelScope模型即服务

114_预训练：Masked LM优化与动态掩码效率深度解析

在大型语言模型（LLM）的预训练阶段，训练目标函数的设计直接影响模型的学习效率和最终性能。Masked Language Modeling（MLM）作为BERT等模型采用的核心预训练任务，通过随机掩盖文本中的部分token并让模型预测这些被掩盖的token，有效地训练了模型的双向表示能力。然而，传统的静态掩码策略存在重复率高、训练效率低等问题。动态掩码技术的引入显著提升了预训练效率和模型性能。本文将全面探讨MLM优化策略，深入推导动态掩码的效率提升原理，并介绍2025年最新的MLM优化技术，为高效预训练LLM提供理论和实践指导。

# 云解析DNS # 缓存 # 自然语言处理 # PyTorch # 算法框架/工具 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

异构计算