AI芯片的搜索结果_热门_第17页-阿里云开发者社区

-开发达人-

|

博文

ISSCC 2022 | 兼顾能效、精度和灵活性，可重构数字存算一体架构打开高算力AI芯片新范式

# 存储 # 机器学习/深度学习 # 人工智能 # 缓存 # 数据中心 # 芯片 # 数据格式 # 计算机视觉 # AI芯片 # 内存技术

zxvf_lnn

|

博文

YOLOX详细解读（一）论文解读

# 编解码 # 人工智能 # 自动驾驶 # 算法 # 数据挖掘 # 计算机视觉 # 开发者 # C++ # 异构计算 # AI芯片

楠竹11

|

博文

为何NPU是开启终端侧生成式AI的关键？

【2月更文挑战第17天】为何NPU是开启终端侧生成式AI的关键？

# 机器学习/深度学习 # 人工智能 # UED # 异构计算 # AI芯片

游客gt7qofxar6rlw

|

8月前

|

博文

服务化参数调优实战

本文介绍了服务化性能调优的全流程，以Llama3-8B模型为例。首先需完成MindIE环境安装、下载模型权重与测试数据集。接着通过计算npuMemSize和maxBatchSize，maxPrefillBatchSize（272）与maxPrefillTokens，并更新配置进行性能测试。结果显示，参数调优后吞吐量提升18%。此方法为大模型性能优化提供了实用指导。

# 测试技术 # AI芯片

RaceSnail

|

7月前

|

博文

飞桨x昇腾生态适配方案：14_loop算子缺失（上）：ONNX模型拆分

本文针对NPU不支持LOOP算子的问题，提出一种解决方案：将ONNX模型拆分为含LOOP算子和不含LOOP算子的子图，单独推理LOOP部分。通过构造包含LOOP算子的ONNX模型，将其转换为JSON格式提取子图，并对子图进行修改（如添加输入节点、删除无关节点）。最后，将JSON转回ONNX格式，完成模型切分与优化。此方法适用于关键路径上的LOOP算子，可有效解决离线推理中的兼容性问题。

# JSON # 数据格式 # AI芯片

三分钟热度的鱼

|

问答

|

来自： ModelScope模型即服务

modelscope-funasr现阶段支持华为的npu吗？

# 自然语言处理 # AI芯片

-开发达人-

|

博文

谷歌长文总结四代TPU打造经验：里程碑式的TPUv4是怎样炼成的？

# 机器学习/深度学习 # 人工智能 # 架构师 # 编译器 # 测试技术 # 程序员 # 数据中心 # 芯片 # AI芯片 # 内存技术

5i77ajz5u7ji6

|

博文

首个完全量化Vision Transformer的方法FQ-ViT | AI大模型落地加速还会远吗？（二）

# 存储 # 编解码 # 人工智能 # 算法 # 数据可视化 # 数据挖掘 # 计算机视觉 # 异构计算 # 索引 # AI芯片

lawliet.

|

博文

SoC系统的低功耗设计（三）功耗降低技术（一）

SoC系统的低功耗设计（三）功耗降低技术

# 架构师 # 算法 # C语言 # 芯片 # 异构计算 # SoC # AI芯片 # 内存技术

hw2020hw

|

8月前

|

博文

DeepSeek模型MOE结构代码详解

其实在DeepSeek-R1爆火之前，DeepSeek V2在我们行业就已经妇孺皆知了，它独特的MOE结构值得研究一下。这篇文章是基于 @ZOMI酱的2个视频写的，这2个视频讲的很好，建议大家都学习一下：《MOE终于迎来可视化解读！傻瓜都能看懂MoE核心原理！》和《使用昇腾NPU手撕MoE单机版代码！没想到如此简单！》。

# 负载均衡 # 数据可视化 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片