PyTorch的搜索结果_第7页-阿里云开发者社区

土木林森

|

30天前

|

博文

【10月更文挑战第5天】深度学习中，模型微调虽能提升性能，但也常导致灾难性遗忘，即学习新任务时遗忘旧知识。本文介绍几种有效解决方案，重点讲解弹性权重巩固（EWC）方法，通过在损失函数中添加正则项来防止重要权重被更新，保护模型记忆。文中提供了基于PyTorch的代码示例，包括构建神经网络、计算Fisher信息矩阵和带EWC正则化的训练过程。此外，还介绍了其他缓解灾难性遗忘的方法，如LwF、在线记忆回放及多任务学习，以适应不同应用场景。

# 机器学习/深度学习 # PyTorch # 算法框架/工具

土木林森

|

30天前

|

博文

如何在一夜之间成为模型微调大师？——从零开始的深度学习修炼之旅，让你的算法功力飙升！

【10月更文挑战第5天】在机器学习领域，预训练模型具有强大的泛化能力，但直接使用可能效果不佳，尤其在特定任务上。此时，模型微调显得尤为重要。本文通过图像分类任务，详细介绍如何利用PyTorch对ResNet-50模型进行微调，包括环境搭建、数据预处理、模型加载与训练等步骤，并提供完整Python代码。通过调整超参数和采用早停策略等技巧，可进一步优化模型性能。适合初学者快速上手模型微调。

# 机器学习/深度学习 # 数据采集 # 算法 # PyTorch # 算法框架/工具

GuGuStudy

|

1月前

|

博文

【机器学习】大模型环境下的应用：计算机视觉的探索与实践

# 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # 计算机视觉

Deephub

|

1月前

|

博文

|

来自：大数据与机器学习

三种Transformer模型中的注意力机制介绍及Pytorch实现：从自注意力到因果自注意力

本文深入探讨了Transformer模型中的三种关键注意力机制：自注意力、交叉注意力和因果自注意力，这些机制是GPT-4、Llama等大型语言模型的核心。文章不仅讲解了理论概念，还通过Python和PyTorch从零开始实现这些机制，帮助读者深入理解其内部工作原理。自注意力机制通过整合上下文信息增强了输入嵌入，多头注意力则通过多个并行的注意力头捕捉不同类型的依赖关系。交叉注意力则允许模型在两个不同输入序列间传递信息，适用于机器翻译和图像描述等任务。因果自注意力确保模型在生成文本时仅考虑先前的上下文，适用于解码器风格的模型。通过本文的详细解析和代码实现，读者可以全面掌握这些机制的应用潜力。

# 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # 数据建模 # PyTorch # 算法框架/工具

深语人工智能DeepNLP

|

1月前

|

博文

|

来自： ModelScope模型即服务

Text2Video Huggingface Pipeline 文生视频接口和文生视频论文API

文生视频是AI领域热点，很多文生视频的大模型都是基于 Huggingface的 diffusers的text to video的pipeline来开发。国内外也有非常多的优秀产品如Runway AI、Pika AI 、可灵King AI、通义千问、智谱的文生视频模型等等。为了方便调用，这篇博客也尝试了使用 PyPI的text2video的python库的Wrapper类进行调用，下面会给大家介绍一下Huggingface Text to Video Pipeline的调用方式以及使用通用的text2video的python库调用方式。

# 人工智能 # 自然语言处理 # PyTorch # API # Python

武子康

|

1月前

|

博文

Ubuntu18 服务器更新升级CUDA版本 pyenv nvidia ubuntu1804 原11.2升级到PyTorch要求12.1 全过程详细记录 apt update

# 并行计算 # Ubuntu # 算法 # PyTorch # 算法框架/工具

武子康

|

1月前

|

博文

StableDiffusion-03 (准备篇)15分钟部署服务并进行LoRA微调全过程详细记录不到20张百变小樱Sakura微调 3090(24GB) 学不会你打我！（一）

# 并行计算 # Ubuntu # 物联网 # PyTorch # Python

nanshaws

|

1月前

|

博文

大模型中 .safetensors 文件、.ckpt文件、.gguf和.pth以及.bin文件区别、加载和保存以及转换方式

本文讨论了大模型中不同文件格式如`.safetensors`、`.ckpt`、`.gguf`、`.pth`和`.bin`的区别、用途以及如何在TensorFlow、PyTorch和ONNX等框架之间进行加载、保存和转换。

# PyTorch # TensorFlow # API # 算法框架/工具 # Python

nanshaws

|

1月前

|

博文

深度学习如何入门？

深度学习入门的指南，包括准备基础知识、学习深度学习理论、实践操作、进阶学习、参与社区和不断实践与反思等步骤。

# 机器学习/深度学习 # 自然语言处理 # 算法 # PyTorch # 算法框架/工具

ZOMI酱

|

1月前

|

博文

【AI系统】AI 系统与程序代码关系

在人工智能领域，系统与程序代码间的关系错综复杂。AI系统的设计需高效代码支撑，而代码优化与执行又受制于系统设计。本文剖析二者间的互动及其对AI进步的关键作用，涵盖AI训练流程、经典模型LeNet5实现、底层算子与系统问题，并探讨如何通过高效代码与系统优化推动AI技术革新，提升模型性能。欢迎访问昇腾社区获取更多AI学习资源与实践机会。

# 机器学习/深度学习 # 人工智能 # PyTorch # 算法框架/工具 # 开发者

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

PyTorch