并行计算的搜索结果_文章_第15页-阿里云开发者社区

武子康

|

2月前

|

博文

StableDiffusion-03 (准备篇)15分钟部署服务并进行LoRA微调全过程详细记录不到20张百变小樱Sakura微调 3090(24GB) 学不会你打我！（一）

# 并行计算 # Ubuntu # 物联网 # PyTorch # Python

nanshaws

|

2月前

|

博文

卸载原有的cuda，更新cuda

本文提供了一个更新CUDA版本的详细指南，包括如何查看当前CUDA版本、检查可安装的CUDA版本、卸载旧版本CUDA以及安装新版本的CUDA。

# 并行计算 # 异构计算

楠竹11

|

2月前

|

博文

用60%成本干80%的事，DeepSeek分享沉淀多年的高性能深度学习架构

【10月更文挑战第2天】近年来，深度学习（DL）与大型语言模型（LLMs）的发展推动了AI的进步，但也带来了计算资源的极大需求。为此，DeepSeek团队提出了Fire-Flyer AI-HPC架构，通过创新的软硬件协同设计，利用10,000个PCIe A100 GPU，实现了高性能且低成本的深度学习训练。相比NVIDIA的DGX-A100，其成本减半，能耗降低40%，并在网络设计、通信优化、并行计算和文件系统等方面进行了全面优化，确保系统的高效与稳定。[论文地址](https://arxiv.org/pdf/2408.14158)

# 机器学习/深度学习 # 存储 # 人工智能 # 并行计算 # 异构计算

那年春天

|

2月前

|

博文

如何提高 Python 高阶函数的性能？

【10月更文挑战第2天】

# 缓存 # 并行计算 # 算法 # 测试技术 # Python

大树营养快线

|

2月前

|

博文

函数式编程和面向对象编程在性能上有何差异？

【10月更文挑战第2天】

# 缓存 # 并行计算 # 算法 # Java # 编译器

小言从不摸鱼

|

2月前

|

博文

探索PyTorch：张量数值计算

# GPU云服务器 # 存储 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

nanshaws

|

2月前

|

博文

C++矢量运算与java矢量运算

本文探讨了C++和Java中的矢量运算与标量运算的性能比较，解释了矢量运算的原理和为什么它比标量运算快，包括并行性、数据局部性、指令优化和数据重用等优势。文章还提供了C++和Java的矢量运算示例代码，并展示了运行结果，以证明矢量运算在处理大量数据时的性能优势。

# 缓存 # 并行计算 # Java # C++

小言从不摸鱼

|

2月前

|

博文

【机器学习】探索GRU：深度学习中门控循环单元的魅力

# 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具

nanshaws

|

2月前

|

博文

yolov5的train.py的参数信息解析

这篇文章解析了YOLOv5的`train.py`脚本中的参数信息，详细介绍了每个参数的功能和默认值，包括权重路径、模型配置、数据源、超参数、训练轮数、批量大小、图像尺寸、训练选项、设备选择、优化器设置等，以便用户可以根据需要自定义训练过程。

# 云解析DNS # 存储 # 缓存 # 并行计算 # 异构计算

nanshaws

|

2月前

|

博文

yolov5的detect.py的详细讲解

这篇文章详细讲解了YOLOv5的`detect.py`脚本中的参数，包括模型权重、输入源、图像尺寸、置信度阈值、IOU阈值、设备选择、结果显示、结果保存等，以及如何使用这些参数进行目标检测。

# 并行计算 # 计算机视觉

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

并行计算