AI芯片的搜索结果_热门_第3页-阿里云开发者社区

ZOMI酱

|

博文

中科寒武纪科技股份有限公司，成立于2016年，致力于打造云边端一体、软硬件协同的智能芯片产品和平台化基础系统软件。寒武纪的产品线涵盖了终端智能处理器IP、边缘端和云端智能加速卡，形成了从1A处理器核到思元系列MLU100、MLU200、MLU300的完整布局。其核心技术包括高效的MLU Core架构和Cambricon Neuware软件栈，支持高性能AI计算，助力机器更好地理解和服务人类。

# GPU云服务器 # 人工智能 # 算法框架/工具 # 芯片 # AI芯片 # 内存技术

aliyun9170107523-43660

|

2月前

|

博文

# 大模型优化与压缩技术：2025年的实践与突破

2025年，随着大语言模型的规模和复杂度不断提升，模型优化与压缩技术已成为AI产业落地的关键瓶颈和研究热点。根据最新统计，顶级大语言模型的参数规模已突破万亿级别，如DeepSeek-R1模型的6710亿参数规模，这带来了前所未有的计算资源需求和部署挑战。在这种背景下，如何在保持模型性能的同时，降低计算成本、减少内存占用、提升推理速度，已成为学术界和产业界共同关注的核心问题。

# 机器学习/深度学习 # 人工智能 # 物联网 # 异构计算 # AI芯片

ZOMI酱

|

博文

【AI系统】NPU 基础

近年来，AI技术迅猛发展，催生了NPU和TPU等AI专用处理器，这些处理器专为加速深度学习任务设计，相比传统CPU和GPU，展现出更高效率和性能。本文将介绍AI芯片的概念、技术发展、部署方式及应用场景，涵盖从数据中心到边缘设备的广泛领域，探讨其如何成为AI技术落地的关键推手。

# GPU云服务器 # FPGA云服务器 # 人工智能 # 自动驾驶 # 芯片 # 异构计算 # AI芯片

极智视界

|

博文

|

来自：视觉智能

极智AI | 一文看懂Google TPU脉动阵列加速卷积计算原理

本教程详细解释了 Google TPU 脉动阵列加速卷积计算原理。

# 机器学习/深度学习 # 存储 # 人工智能 # 编解码 # AI芯片

技术员阿伟

|

11月前

|

博文

《深度揭秘：TPU张量计算架构如何重塑深度学习运算》

TPU（张量处理单元）是谷歌为应对深度学习模型计算需求而设计的专用硬件。其核心矩阵乘法单元（MXU）采用脉动阵列架构，显著提升矩阵运算效率；内存管理单元优化数据流通，减少瓶颈；控制单元协调系统运作，确保高效稳定。TPU在训练和推理速度、能耗方面表现出色，大幅缩短BERT等模型的训练时间，降低数据中心成本。尽管通用性和易用性仍有挑战，但TPU已为深度学习带来革命性变化，未来有望进一步优化。

# GPU云服务器 # 机器学习/深度学习 # 存储 # 数据中心 # 异构计算 # AI芯片

1744812029540769

|

博文

|

来自：云原生

揭秘A100、A800、H800、V100在高性能计算与大模型训练中的地位

英伟达前段时间发布GH 200包含 36 个 NVLink 开关，将 256 个 GH200 Grace Hopper 芯片和 144TB 的共享内存连接成一个单元。除此之外，英伟达A100、A800、H100、V100也在大模型训练中广受欢迎。

# 超级计算集群 # 数据传输服务 # GPU云服务器 # 自然语言处理 # 机器学习/深度学习 # 存储 # 人工智能 # 并行计算 # 算法 # 数据中心 # 芯片 # 开发者 # 异构计算 # AI芯片

AI之家

|

博文

【人工智能】CPU、GPU与TPU：人工智能领域的核心处理器概述

在人工智能和计算技术的快速发展中，CPU（中央处理器）、GPU（图形处理器）和TPU（张量处理器）作为核心处理器，各自扮演着不可或缺的角色。它们不仅在性能上各有千秋，还在不同的应用场景中发挥着重要作用

# GPU云服务器 # 机器学习/深度学习 # 人工智能 # 并行计算 # 异构计算 # AI芯片

TsingtaoAI

|

11月前

|

博文

企业内训｜基于华为昇腾910B算力卡的大模型部署和调优-上海某央企智算中心

近日上海，TsingtaoAI为某央企智算中心交付华为昇腾910B算力卡的大模型部署和调优课程。课程深入讲解如何在昇腾NPU上高效地训练、调优和部署PyTorch与Transformer模型，并结合实际应用场景，探索如何优化和迁移模型至昇腾NPU平台。课程涵盖从模型预训练、微调、推理与评估，到性能对比、算子适配、模型调优等一系列关键技术，帮助学员深入理解昇腾NPU的优势及其与主流深度学习框架（如PyTorch、Deepspeed、MindSpore）的结合应用。

# GPU云服务器 # 性能测试 # 机器学习/深度学习 # 机器人 # PyTorch # 算法框架/工具 # AI芯片

游客7dgyrbdm3doqi

|

9月前

|

博文

NPU上运行onnxruntime

在Ascend环境下使用onnxruntime推理时，若安装了GPU版本的onnxruntime（`onnxruntime-gpu`），可能会因缺少CUDA组件报错。正确做法是卸载`onnxruntime-gpu`，并根据官方文档适配NPU，通过源码构建支持CANN的onnxruntime whl包。具体步骤为克隆onnxruntime源码，使用`--use_cann`参数构建，并安装生成的whl包。最后，配置CANNExecutionProvider进行推理。

# 并行计算 # 开发工具 # git # 异构计算 # AI芯片

汀丶人工智能

|

博文

军事领域关系抽取：UIE Slim最新升级版含数据标注、serving部署、模型蒸馏等教学，助力工业应用场景快速落地

# 云数据库 ClickHouse # GPU云服务器 # 自然语言处理 # 数据处理 # API # 知识图谱 # 异构计算 # 并行计算 # 算法 # 数据可视化 # 数据格式 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片