并行计算的搜索结果_热门_第20页-阿里云开发者社区

LeapMay

|

博文

CUDA和显卡驱动以及pytorch版本的对应关系

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # PyTorch # 编译器 # 算法框架/工具 # 开发工具 # 图形学 # 数据中心 # C++ # 异构计算

程序员行者孙

|

博文

【已解决】RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors might be asynchronous

# 机器学习/深度学习 # 并行计算 # PyTorch # API # 算法框架/工具

弹性计算-小弹

|

博文

|

来自：弹性计算

技术改变AI发展：Ada Lovelace架构解读及RTX 4090性能测试分析（系列三）

简介：随着人工智能（AI）的迅速发展，越来越多的应用需要巨大的GPU计算资源。Ada lovelace（后面简称Ada）是NVIDIA最新的图形处理器架构，随2022年9月20日发布的RTX 4090一起公布。

# GPU云服务器 # 性能测试 # 人工智能 # 缓存 # 并行计算 # 测试技术 # 异构计算

Deephub

|

7月前

|

博文

|

来自：大数据与机器学习

在AMD GPU上部署AI大模型：从ROCm环境搭建到Ollama本地推理实战指南

本文详细介绍了在AMD硬件上构建大型语言模型（LLM）推理环境的全流程。以RX 7900XT为例，通过配置ROCm平台、部署Ollama及Open WebUI，实现高效本地化AI推理。尽管面临技术挑战，但凭借高性价比（如700欧元的RX 7900XT性能接近2200欧元的RTX 5090），AMD方案成为经济实用的选择。测试显示，不同规模模型的推理速度从9到74 tokens/秒不等，满足交互需求。随着ROCm不断完善，AMD生态将推动AI硬件多元化发展，为个人与小型组织提供低成本、低依赖的AI实践路径。

# GPU云服务器 # 人工智能 # 并行计算 # 监控 # Linux # 异构计算

HermanYe996

|

博文

Ubuntu下CUDA、Conda、Pytorch联合教程

本文是一份Ubuntu系统下安装和配置CUDA、Conda和Pytorch的教程，涵盖了查看显卡驱动、下载安装CUDA、添加环境变量、卸载CUDA、Anaconda的下载安装、环境管理以及Pytorch的安装和验证等步骤。

# 并行计算 # Ubuntu # PyTorch # 算法框架/工具

七镜

|

博文

【pytorch】解决pytorch:Torch not compiled with CUDA enabled

# 并行计算 # PyTorch # 算法框架/工具 # 异构计算

ZOMI酱

|

博文

【AI系统】SIMD & SIMT 与芯片架构

本文深入解析了SIMD（单指令多数据）与SIMT（单指令多线程）的计算本质及其在AI芯片中的应用，特别是NVIDIA CUDA如何实现这两种计算模式。SIMD通过单指令对多个数据进行操作，提高数据并行处理能力；而SIMT则在GPU上实现了多线程并行，每个线程独立执行相同指令，增强了灵活性和性能。文章详细探讨了两者的硬件结构、编程模型及硬件执行模型的区别与联系，为理解现代AI计算架构提供了理论基础。

# GPU云服务器 # 人工智能 # 并行计算 # 程序员 # 异构计算 # 索引

弹性计算-小弹

|

博文

|

来自：弹性计算

技术改变AI发展：CUDA Graph优化的底层原理分析（GPU底层技术系列一）

随着人工智能（AI）的迅速发展，越来越多的应用需要巨大的GPU计算资源。CUDA是一种并行计算平台和编程模型，由Nvidia推出，可利用GPU的强大处理能力进行加速计算。

# GPU云服务器 # 人工智能 # 弹性计算 # 并行计算 # API # 异构计算

ModelScope内容运营小助手

|

博文

MinerU-大语言语料处理神器，CPU/GPU均可跑，开源免费“敲”好用

在7月4日举行的WAIC 2024科学前沿主论坛上，书生·浦语2.5正式发布，面向大模型研发与应用的全链条工具体系同时迎来升级。

# 云解析DNS # GPU云服务器 # 人工智能 # 自然语言处理 # 文字识别 # 并行计算 # 异构计算

delacroix_xu-15509

|

博文

|

来自：弹性计算

AVX2指令集简介和代码示例

这篇文章介绍了AVX2指令集，它是Intel在2013年为提高处理器并行计算能力引入的SIMD技术。AVX2增强了整数运算，包括256位操作和位操作，还提供了FMA指令及更多广播和转换功能。与AVX相比，AVX2在图像处理和媒体编码等领域有显著优势。文章通过一个C代码示例展示了如何使用AVX2进行向量加法，并提醒编译时需确保支持AVX2指令集。

# 机器学习/深度学习 # 并行计算 # 编译器 # 数据处理 # C语言

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

并行计算