AI芯片的搜索结果_热门_第7页-阿里云开发者社区

AI之家

|

博文

【人工智能】CPU、GPU与TPU：人工智能领域的核心处理器概述

在人工智能和计算技术的快速发展中，CPU（中央处理器）、GPU（图形处理器）和TPU（张量处理器）作为核心处理器，各自扮演着不可或缺的角色。它们不仅在性能上各有千秋，还在不同的应用场景中发挥着重要作用

# GPU云服务器 # 机器学习/深度学习 # 人工智能 # 并行计算 # 异构计算 # AI芯片

aliyun9170107523-43660

|

2月前

|

博文

# 大模型优化与压缩技术：2025年的实践与突破

2025年，随着大语言模型的规模和复杂度不断提升，模型优化与压缩技术已成为AI产业落地的关键瓶颈和研究热点。根据最新统计，顶级大语言模型的参数规模已突破万亿级别，如DeepSeek-R1模型的6710亿参数规模，这带来了前所未有的计算资源需求和部署挑战。在这种背景下，如何在保持模型性能的同时，降低计算成本、减少内存占用、提升推理速度，已成为学术界和产业界共同关注的核心问题。

# 机器学习/深度学习 # 人工智能 # 物联网 # 异构计算 # AI芯片

产品人卫朋

|

博文

【IoT】产品设计：ID设计和MD设计详解

ID与MD设计

# JavaScript # 安全 # 物联网 # UED # AI芯片

极智视界

|

博文

|

来自：视觉智能

极智AI | 一文看懂Google TPU脉动阵列加速卷积计算原理

本教程详细解释了 Google TPU 脉动阵列加速卷积计算原理。

# 机器学习/深度学习 # 存储 # 人工智能 # 编解码 # AI芯片

技术员阿伟

|

11月前

|

博文

《深度揭秘：TPU张量计算架构如何重塑深度学习运算》

TPU（张量处理单元）是谷歌为应对深度学习模型计算需求而设计的专用硬件。其核心矩阵乘法单元（MXU）采用脉动阵列架构，显著提升矩阵运算效率；内存管理单元优化数据流通，减少瓶颈；控制单元协调系统运作，确保高效稳定。TPU在训练和推理速度、能耗方面表现出色，大幅缩短BERT等模型的训练时间，降低数据中心成本。尽管通用性和易用性仍有挑战，但TPU已为深度学习带来革命性变化，未来有望进一步优化。

# GPU云服务器 # 机器学习/深度学习 # 存储 # 数据中心 # 异构计算 # AI芯片

aliyun9170107523-43660

|

2月前

|

博文

24_BERT模型详解：从预训练到微调的全方位指南

BERT（Bidirectional Encoder Representations from Transformers）是由Google AI在2018年推出的革命性预训练语言模型，它彻底改变了自然语言处理（NLP）领域的格局。通过创新的双向训练方式，BERT能够捕捉词语在上下文环境中的完整语义信息，从而在各种下游任务中取得了突破性的表现。

# 人工智能 # 自然语言处理 # 调度 # AI芯片 # SEO

hw2020hw

|

6月前

|

博文

大模型推理显存和计算量估计方法

最近做吞吐量调试涉及到输入batch_size的设置，为了把算力和显存用起来，同时不触发out of memory，需要提前估计大模型推理过程中的显存占用

# 机器学习/深度学习 # 存储 # 缓存 # Shell # AI芯片

1744812029540769

|

博文

|

来自：云原生

揭秘A100、A800、H800、V100在高性能计算与大模型训练中的地位

英伟达前段时间发布GH 200包含 36 个 NVLink 开关，将 256 个 GH200 Grace Hopper 芯片和 144TB 的共享内存连接成一个单元。除此之外，英伟达A100、A800、H100、V100也在大模型训练中广受欢迎。

# 超级计算集群 # 数据传输服务 # GPU云服务器 # 自然语言处理 # 机器学习/深度学习 # 存储 # 人工智能 # 并行计算 # 算法 # 数据中心 # 芯片 # 开发者 # 异构计算 # AI芯片

汀丶人工智能

|

博文

军事领域关系抽取：UIE Slim最新升级版含数据标注、serving部署、模型蒸馏等教学，助力工业应用场景快速落地

# 云数据库 ClickHouse # GPU云服务器 # 自然语言处理 # 数据处理 # API # 知识图谱 # 异构计算 # 并行计算 # 算法 # 数据可视化 # 数据格式 # AI芯片

游客7dgyrbdm3doqi

|

9月前

|

博文

NPU上运行onnxruntime

在Ascend环境下使用onnxruntime推理时，若安装了GPU版本的onnxruntime（`onnxruntime-gpu`），可能会因缺少CUDA组件报错。正确做法是卸载`onnxruntime-gpu`，并根据官方文档适配NPU，通过源码构建支持CANN的onnxruntime whl包。具体步骤为克隆onnxruntime源码，使用`--use_cann`参数构建，并安装生成的whl包。最后，配置CANNExecutionProvider进行推理。

# 并行计算 # 开发工具 # git # 异构计算 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片