PyTorch的搜索结果_热门_第6页-阿里云开发者社区

chian-ocean

|

博文

本文深入探讨了大规模语言模型（LLMs）和生成模型的技术原理、经典架构及应用。介绍了LLMs的关键特点，如海量数据训练、深层架构和自监督学习，以及常见模型如GPT、BERT和T5。同时，文章详细解析了生成模型的工作原理，包括自回归模型、自编码器和GANs，并讨论了这些模型在自然语言生成、机器翻译、对话系统和数据增强等领域的应用。最后，文章展望了未来的发展趋势，如模型压缩、跨模态生成和多语言多任务学习。

# 函数计算 # 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # 分布式计算 # PyTorch # 算法框架/工具

zzy的aly

|

博文

深度学习之格式转换笔记(一)：模型文件pt转onnx转tensorrt格式实操成功

关于如何将深度学习模型从PyTorch的.pt格式转换为ONNX格式，然后再转换为TensorRT格式的实操指南。

# 机器学习/深度学习 # PyTorch # 算法框架/工具

Deephub

|

10月前

|

博文

|

来自：大数据与机器学习

DeepSeek 背后的技术：GRPO，基于群组采样的高效大语言模型强化学习训练方法详解

强化学习（RL）是提升大型语言模型（LLM）推理能力的重要手段，尤其在复杂推理任务中表现突出。DeepSeek团队通过群组相对策略优化（GRPO）方法，在DeepSeek-Math和DeepSeek-R1模型中取得了突破性成果，显著增强了数学推理和问题解决能力。GRPO无需价值网络，采用群组采样和相对优势估计，有效解决了传统RL应用于语言模型时的挑战，提升了训练效率和稳定性。实际应用中，DeepSeek-Math和DeepSeek-R1分别在数学推理和复杂推理任务中展现了卓越性能。未来研究将聚焦于改进优势估计、自适应超参数调整及理论分析，进一步拓展语言模型的能力边界。

# 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具

码农工程师

|

博文

364 页 PyTorch 版《动手学深度学习》PDF 开源了（全中文，支持 Jupyter 运行）

# 机器学习/深度学习 # 人工智能 # PyTorch # 算法框架/工具 # Python

皮卡丘敲爱Kedreamix

|

博文

Pytorch 各个GPU版本CUDA和cuDNN对应版本

# GPU云服务器 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算 # Python

八进智

|

2月前

|

博文

|

来自：通义大模型

使用TensorRT LLM构建和运行Qwen模型

本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型，涵盖模型转换、引擎构建、量化推理及LoRA微调等操作，并提供详细的代码示例与支持矩阵。

# 大模型服务平台百炼 # 缓存 # 物联网 # PyTorch # 测试技术 # 异构计算

AIweker

|

博文

一篇就够：高性能推理引擎理论与实践 (TensorRT)

本文分享了关于 NVIDIA 推出的高性能的深度学习推理引擎 TensorRT 的背后理论知识和实践操作指南。

# GPU云服务器 # 云解析DNS # 机器学习/深度学习 # 存储 # 并行计算 # PyTorch # TensorFlow # 调度 # 算法框架/工具 # 开发工具 # 异构计算 # Python

Deephub

|

4天前

|

博文

深度解析 Google JAX 全栈：带你上手开发，从零构建神经网络

Google凭借JAX AI栈实现AI全栈垂直整合，覆盖模型、应用、云与硬件。JAX结合XLA编译器，Flax构建网络，Optax优化训练，Orbax管理 checkpoint，已在Google及Anthropic、Apple等广泛应用，助力高效大规模AI训练。

# 机器学习/深度学习 # 人工智能 # PyTorch # 算法框架/工具 # Python

半颗糖也甜入人心

|

博文

|

来自： ModelScope模型即服务

Dropout的深入理解（基础介绍、模型描述、原理深入、代码实现以及变种）

# 机器学习/深度学习 # PyTorch # 算法框架/工具 # Python

使者大牙

|

博文

RPN(Region Proposal Networks)候选区域网络算法解析（附PyTorch代码）

# 云解析DNS # 机器人流程自动化 # 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch