AI芯片的搜索结果_第2页-阿里云开发者社区

aliyun9170107523-43660

|

2月前

|

博文

# 大模型优化与压缩技术：2025年的实践与突破

2025年，随着大语言模型的规模和复杂度不断提升，模型优化与压缩技术已成为AI产业落地的关键瓶颈和研究热点。根据最新统计，顶级大语言模型的参数规模已突破万亿级别，如DeepSeek-R1模型的6710亿参数规模，这带来了前所未有的计算资源需求和部署挑战。在这种背景下，如何在保持模型性能的同时，降低计算成本、减少内存占用、提升推理速度，已成为学术界和产业界共同关注的核心问题。

# 机器学习/深度学习 # 人工智能 # 物联网 # 异构计算 # AI芯片

DuHz

|

3月前

|

博文

|

来自：物联网

H4H：面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索——论文阅读

H4H是一种面向AR/VR应用的混合卷积-Transformer架构，基于NPU-CIM异构系统，通过神经架构搜索实现高效模型设计。该架构结合卷积神经网络（CNN）的局部特征提取与视觉Transformer（ViT）的全局信息处理能力，提升模型性能与效率。通过两阶段增量训练策略，缓解混合模型训练中的梯度冲突问题，并利用异构计算资源优化推理延迟与能耗。实验表明，H4H在相同准确率下显著降低延迟和功耗，为AR/VR设备上的边缘AI推理提供了高效解决方案。

# 机器学习/深度学习 # 人工智能 # vr&ar # Ruby # AI芯片

Deephub

|

4月前

|

博文

|

来自：大数据与机器学习

AMD Ryzen AI Max+ 395四机并联：大语言模型集群推理深度测试

本文介绍了使用四块Framework主板构建AI推理集群的过程，并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试，重点评估其并行推理能力及集群表现。

# 人工智能 # 测试技术 # 芯片 # 异构计算 # AI芯片

Deephub

|

4月前

|

博文

|

来自：大数据与机器学习

JAX快速上手：从NumPy到GPU加速的Python高性能计算库入门教程

JAX是Google开发的高性能数值计算库，旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API，还引入了自动微分、GPU/TPU加速和即时编译（JIT）等关键功能，显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景，为Python在高性能计算领域开辟了新路径。

# GPU云服务器 # 机器学习/深度学习 # API # 异构计算 # Python # AI芯片

张小龙

|

4月前

|

问答

|

来自：通义大模型

在美国的限制下，中国人工智能公司结成联盟，建立国内生态系统?

# 大模型服务平台百炼 # 芯片 # 人工智能 # 定位技术 # 开发者 # AI芯片 # 数据中心

游客5wkefycldfcuc

|

5月前

|

问答

|

来自： ModelScope模型即服务

请问MNN支持在高通或者MTK平台上部署大模型吗？

# 图像识别 # AI芯片

游客nzxqk2keol6fs

|

6月前

|

博文

了解集合通信与模型并行策略

了解集合通信基础概念及常见的集合通信原语；以及大模型并行策略：包括数据并行、流水并行、张量并行和专家并行。

# 机器学习/深度学习 # 存储 # 并行计算 # 物联网 # AI芯片

hw2020hw

|

6月前

|

博文

大模型推理显存和计算量估计方法

最近做吞吐量调试涉及到输入batch_size的设置，为了把算力和显存用起来，同时不触发out of memory，需要提前估计大模型推理过程中的显存占用

# 机器学习/深度学习 # 存储 # 缓存 # Shell # AI芯片

游客jnstwksgqnrgi

|

6月前

|

博文

昇腾AI4S图机器学习：DGL消息传递接口的PyG替换

DGL (Deep Graph Learning) 和 PyG (Pytorch Geometric) 是两个主流的图神经网络库，它们在API设计和底层实现上有一定差异，在不同场景下，研究人员会使用不同的依赖库，昇腾NPU对PyG图机器学习库的支持亲和度更高，因此有些时候需要做DGL接口的PyG替换。

# 机器学习/深度学习 # PyTorch # API # 算法框架/工具 # AI芯片

Star时光

|

6月前

|

博文

AI进化论：从识别模式到创造世界的“数字大脑”

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 搜索推荐 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片