GPU云服务器的搜索结果_热门_第16页-阿里云开发者社区

samson33ss

|

7月前

|

博文

|

1.混沌工程不仅仅是技术过关的利器，更是AI系统完美运转的“防火墙”。ChaosMeta通过全方位、多层次的故障注入和演练，帮助AI系统在复杂多变的环境中维持高稳定性。 2.结合混沌工程的思想，我们不仅可以在开发阶段找到和修复问题，还能在运维阶段持续提升系统的鲁棒性。在这个高速发展的AI年代，ChaosMeta将为AI系统提供稳定性保障，让AI系统走得更远、更稳。 3.抽空试试ChaosMeta，也许下一个故障发生时，你会发现，原来一切尽在掌握。

# GPU云服务器 # 日志服务 # 存储 # 人工智能 # 运维 # 监控 # 异构计算

郑小健

|

6月前

|

博文

|

来自：大数据与机器学习

PyTorch与DistributedDataParallel：分布式训练入门指南

【8月更文第27天】随着深度学习模型变得越来越复杂，单一GPU已经无法满足训练大规模模型的需求。分布式训练成为了加速模型训练的关键技术之一。PyTorch 提供了多种工具来支持分布式训练，其中 DistributedDataParallel (DDP) 是一个非常受欢迎且易用的选择。本文将详细介绍如何使用 PyTorch 的 DDP 模块来进行分布式训练，并通过一个简单的示例来演示其使用方法。

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

路人与大师

|

3月前

|

博文

|

来自：通义大模型

探索大模型部署：基于 VLLM 和 ModelScope 与 Qwen2.5 在双 32G VGPU 上的实践之旅

本文介绍了使用 `VLLM` 和 `ModelScope` 部署 `Qwen2.5` 大模型的实践过程，包括环境搭建、模型下载和在双 32G VGPU 上的成功部署，展现了高性能计算与大模型结合的强大力量。

# GPU云服务器 # 人工智能 # 自然语言处理 # 并行计算 # 机器人 # 异构计算

TsingtaoAI

|

10天前

|

博文

企业内训｜基于华为昇腾910B算力卡的大模型部署和调优-上海某央企智算中心

近日上海，TsingtaoAI为某央企智算中心交付华为昇腾910B算力卡的大模型部署和调优课程。课程深入讲解如何在昇腾NPU上高效地训练、调优和部署PyTorch与Transformer模型，并结合实际应用场景，探索如何优化和迁移模型至昇腾NPU平台。课程涵盖从模型预训练、微调、推理与评估，到性能对比、算子适配、模型调优等一系列关键技术，帮助学员深入理解昇腾NPU的优势及其与主流深度学习框架（如PyTorch、Deepspeed、MindSpore）的结合应用。

# GPU云服务器 # 性能测试 # 机器学习/深度学习 # 机器人 # PyTorch # 算法框架/工具 # AI芯片

阿里云云原生

|

5月前

|

博文

|

来自：云原生

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

本文带大家了解一下如何使用阿里云Serverless计算产品函数计算构建生产级别的LLM Chat应用。该最佳实践会指导大家基于开源WebChat组件LobeChat和阿里云函数计算（FC）构建企业生产级别LLM Chat应用。实现同一个WebChat中既可以支持自定义的Agent，也支持基于Ollama部署的开源模型场景。

# 微服务引擎 # 容器镜像服务 # API 网关 # 云解析DNS # 域名 # GPU云服务器 # 函数计算 # 文件存储 NAS # 对象存储 # 云原生数据库 PolarDB # 专有网络VPC # Cloud Native # 关系型数据库 # Serverless # API # 数据库

zzy的aly

|

4月前

|

博文

目标检测实战(八): 使用YOLOv7完成对图像的目标检测任务（从数据准备到训练测试部署的完整流程）

本文介绍了如何使用YOLOv7进行目标检测，包括环境搭建、数据集准备、模型训练、验证、测试以及常见错误的解决方法。YOLOv7以其高效性能和准确率在目标检测领域受到关注，适用于自动驾驶、安防监控等场景。文中提供了源码和论文链接，以及详细的步骤说明，适合深度学习实践者参考。

# GPU云服务器 # 机器学习/深度学习 # 监控 # 计算机视觉 # 异构计算 # Python

LeapMay

|

博文

CUDA和显卡驱动以及pytorch版本的对应关系

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # PyTorch # 编译器 # 算法框架/工具 # 开发工具 # 图形学 # 数据中心 # C++ # 异构计算

郑小健

|

6月前

|

博文

|

来自：大数据与机器学习

面向大规模分布式训练的资源调度与优化策略

【8月更文第15天】随着深度学习模型的复杂度不断提高，对计算资源的需求也日益增长。为了加速训练过程并降低运行成本，高效的资源调度和优化策略变得至关重要。本文将探讨在大规模分布式训练场景下如何有效地进行资源调度，并通过具体的代码示例来展示这些策略的实际应用。

# GPU云服务器 # 机器学习/深度学习 # 资源调度 # PyTorch # API # 算法框架/工具

郑小健

|

6月前

|

博文

|

来自：大数据与机器学习

构建高效 PyTorch 模型：内存管理和优化技巧

【8月更文第27天】PyTorch 是一个强大的深度学习框架，被广泛用于构建复杂的神经网络模型。然而，在处理大规模数据集或使用高性能 GPU 进行训练时，有效的内存管理对于提升模型训练效率至关重要。本文将探讨如何在 PyTorch 中有效地管理内存，并提供一些优化技巧及代码示例。

# GPU云服务器 # 机器学习/深度学习 # 数据采集 # PyTorch # 算法框架/工具 # 异构计算

Deephub

|

4月前

|

博文

|

来自：大数据与机器学习

图像数据增强库综述：10个强大图像增强工具对比与分析

在深度学习和计算机视觉领域，数据增强是提升模型性能和泛化能力的关键技术。本文全面介绍了10个广泛使用的图像数据增强库，分析其特点和适用场景，帮助研究人员和开发者选择最适合需求的工具。这些库包括高性能的GPU加速解决方案（如Nvidia DALI）、灵活多功能的Albumentations和Imgaug，以及专注于特定框架的Kornia和Torchvision Transforms。通过详细比较各库的功能、特点和适用场景，本文为不同需求的用户提供丰富的选择，助力深度学习项目取得更好的效果。选择合适的数据增强库需考虑性能需求、任务类型、框架兼容性及易用性等因素。

# GPU云服务器 # 机器学习/深度学习 # PyTorch # 算法框架/工具 # 计算机视觉 # 异构计算

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

GPU云服务器