AI芯片的搜索结果_热门_第14页-阿里云开发者社区

Coder个人博客

|

博文

NPU驱动集成手册

# Linux # AI芯片

-开发达人-

|

博文

谷歌长文总结四代TPU打造经验：里程碑式的TPUv4是怎样炼成的？

# 机器学习/深度学习 # 人工智能 # 架构师 # 编译器 # 测试技术 # 程序员 # 数据中心 # 芯片 # AI芯片 # 内存技术

ZOMI酱

|

博文

AI框架跟计算图什么关系？PyTorch如何表达计算图？

目前主流的深度学习框架都选择使用计算图来抽象神经网络计算表达，通过通用的数据结构（张量）来理解、表达和执行神经网络模型，通过计算图可以把 AI 系统化的问题形象地表示出来。本节将会以AI概念落地的时候，遇到的一些问题与挑战，因此引出了计算图的概念来对神经网络模型进行统一抽象。接着展开什么是计算，计算图的基本构成来深入了解诶计算图。最后简单地学习PyTorch如何表达计算图。

# 机器学习/深度学习 # 人工智能 # 架构师 # PyTorch # 算法框架/工具 # 图计算 # 开发者 # 异构计算 # AI芯片 # Python

云计算助手

|

博文

2023年阿里云GPU服务器租用价格表，附阿里云GPU服务器常见问题解答

2023年阿里云GPU服务器租用价格表，附阿里云GPU服务器常见问题解答。阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用，阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡，GPU云服务器gn6i可享受3折优惠，阿里云百科分享阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表：

# GPU云服务器 # 云服务器 ECS # 超级计算集群 # 弹性裸金属服务器 # 弹性计算 # 虚拟化 # 异构计算 # AI芯片

ZOMI酱

|

博文

【AI系统】内存分配算法

本文探讨了AI编译器前端优化中的内存分配问题，涵盖模型与硬件内存的发展、内存划分及其优化算法。文章首先分析了神经网络模型对NPU内存需求的增长趋势，随后详细介绍了静态与动态内存的概念及其实现方式，最后重点讨论了几种节省内存的算法，如空间换内存、计算换内存、模型压缩和内存复用等，旨在提高内存使用效率，减少碎片化，提升模型训练和推理的性能。

# GPU云服务器 # 机器学习/深度学习 # 人工智能 # 算法 # 异构计算 # AI芯片

游客dnh4fn5yp5gom

|

11月前

|

博文

sam模型迁移昇腾训练loss不收敛问题的解决办法

在将SAM模型迁移到昇腾平台时，遇到了精度问题。具体表现为NPU训练的loss图从一开始就未收敛，而GPU则正常收敛。通过使用Ascend开源仓的msprobe工具进行精度对比，发现NPU丢失了image_embedding的梯度，原因在于torch_npu版本与PyTorch不匹配，导致`repeat_interleave_backward_tensor`函数调用失败。最终通过选择与PyTorch配套的torch_npu版本解决了问题，loss图恢复正常。

# 数据采集 # PyTorch # 算法框架/工具 # 异构计算 # AI芯片

游客gt7qofxar6rlw

|

8月前

|

博文

服务化参数调优实战

本文介绍了服务化性能调优的全流程，以Llama3-8B模型为例。首先需完成MindIE环境安装、下载模型权重与测试数据集。接着通过计算npuMemSize和maxBatchSize，maxPrefillBatchSize（272）与maxPrefillTokens，并更新配置进行性能测试。结果显示，参数调优后吞吐量提升18%。此方法为大模型性能优化提供了实用指导。

# 测试技术 # AI芯片

RaceSnail

|

7月前

|

博文

飞桨x昇腾生态适配方案：02_常用环境变量

本节介绍训练前建议设置的常用环境变量，涵盖NPU私有格式、在线编译、性能优化参数（如`aclnn_scale`和`aclnn_split`）、算子黑名单配置、NPU卡号指定、Paddle内存分配策略及日志设置等内容。通过合理配置这些变量，可有效提升训练性能并解决潜在问题。例如，关闭`FLAGS_npu_storage_format`以禁用NPU私有格式，或调整`ASCEND_MAX_OP_CACHE_SIZE`优化Kernel缓存大小。同时，CANN和Paddle的日志环境变量也提供了调试支持。

# 缓存 # AI芯片

-开发达人-

|

博文

阿里发布首颗量产AI「超大芯片」：高出兄弟公司新品四倍，上云就能用

「这是互联网公司的首颗『大芯片』」，达摩院院长张建锋为其写下注脚。所谓「大芯片」，是指单靠一颗含光 800 NPU，能够在一秒内处理 7.8 万张图片。

# GPU云服务器 # 机器学习/深度学习 # 存储 # 人工智能 # 达摩院 # 算法 # 云计算 # 芯片 # 异构计算 # SoC # AI芯片

老师我作业忘带了

|

博文

CNN-运动鞋品牌识别

# GPU云服务器 # 机器学习/深度学习 # 数据采集 # 监控 # 并行计算 # 数据可视化 # 异构计算 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片