PyTorch的搜索结果_热门_第14页-阿里云开发者社区

Suxiaoxiang

|

1月前

|

博文

从零训练一个 ChatGPT：用 PyTorch 构建自己的 LLM 模型

本文介绍如何使用PyTorch从零构建类似ChatGPT的大型语言模型，涵盖Transformer架构、数据预处理、训练优化及文本生成全过程，助你掌握LLM核心原理与实现技术。（238字）

# 数据采集 # 机器学习/深度学习 # 自然语言处理 # PyTorch # 算法框架/工具

TwcatL_tree

|

博文

更换Anaconda的下载源为国内源的办法

# PyTorch # 算法框架/工具

郑小健

|

博文

|

来自：大数据与机器学习

ONNX 与量化：提高模型效率

【8月更文第27天】随着人工智能技术的广泛应用，模型部署变得越来越重要。为了在资源受限的设备上运行复杂的机器学习模型，模型量化技术成为了一种有效的手段。Open Neural Network Exchange (ONNX) 作为一种开放格式，支持在不同框架之间交换训练好的模型，同时也支持模型量化。本文将探讨如何结合 ONNX 和模型量化技术来提高模型的效率，减少模型大小并加快推理速度。

# 机器学习/深度学习 # PyTorch # TensorFlow # 算法框架/工具 # 开发者

Deephub

|

8月前

|

博文

|

来自：大数据与机器学习

PyTorch CUDA内存管理优化：深度理解GPU资源分配与缓存机制

本文深入探讨了PyTorch中GPU内存管理的核心机制，特别是CUDA缓存分配器的作用与优化策略。文章分析了常见的“CUDA out of memory”问题及其成因，并通过实际案例（如Llama 1B模型训练）展示了内存分配模式。PyTorch的缓存分配器通过内存池化、延迟释放和碎片化优化等技术，显著提升了内存使用效率，减少了系统调用开销。此外，文章还介绍了高级优化方法，包括混合精度训练、梯度检查点技术及自定义内存分配器配置。这些策略有助于开发者在有限硬件资源下实现更高性能的深度学习模型训练与推理。

# GPU云服务器 # 缓存 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

流楚丶格念

|

博文

如何寻找论文及其相关代码？

# 机器学习/深度学习 # Web App开发 # 算法 # PyTorch # 算法框架/工具

竹石yyds

|

10月前

|

博文

|

来自： ModelScope模型即服务

本地部署DeepSeek模型

要在本地部署DeepSeek模型，需准备Linux（推荐Ubuntu 20.04+）或兼容的Windows/macOS环境，配备NVIDIA GPU（建议RTX 3060+）。安装Python 3.8+、PyTorch/TensorFlow等依赖，并通过官方渠道下载模型文件。配置模型后，编写推理脚本进行测试，可选使用FastAPI服务化部署或Docker容器化。注意资源监控和许可协议。

# GPU云服务器 # 并行计算 # PyTorch # 算法框架/工具 # Docker # 容器

路人贾jia

|

博文

YOLOv5入门实践（1）——手把手带你环境配置搭建

# GPU云服务器 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算 # Python

daniel_2000

|

博文

|

来自：大数据与机器学习

pytorch 安装 + 搭配PyCharm

pytorch + pycharm

# 并行计算 # PyTorch # 编译器 # 算法框架/工具 # Python

聚客AI

|

3月前

|

博文

|

来自：阿里云百炼

编码器-解码器架构详解：Transformer如何在PyTorch中工作

本文深入解析Transformer架构，结合论文与PyTorch源码，详解编码器、解码器、位置编码及多头注意力机制的设计原理与实现细节，助你掌握大模型核心基础。建议点赞收藏，干货满满。

# 大模型服务平台百炼 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具

专注算法的马里奥学长

|

博文

HDF5数据的打包与使用（以图像数据为例）

HDF5 数据是存储在一种名为 Hierarchical Data Format version 5 (HDF5) 的二进制文件格式中的数据。这种文件格式可以用来存储大量的多维数据，并且提供了很多的功能来帮助用户组织和管理数据。

# 存储 # 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # 数据格式 # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch