GPU云服务器的搜索结果_热门_第12页-阿里云开发者社区

李麒麟

|

博文

|

来自：云原生

GPU_nvidia-container-toolkit安装和配置

# GPU云服务器 # Ubuntu # Shell # Docker # 异构计算 # 容器

游客bhjvku3fuso4o

|

博文

掌握未来：打造适用于AI人工智能开发的理想电脑配置指南

在当下技术快速发展的时代，人工智能（Artificial Intelligence, AI）已然成为大势所趋。从语音助手到自动驾驶汽车，AI的应用日渐普及。作为计算机科学的一个分支，AI侧重于创造能够执行各种复杂任务的智能机器。为了进行有效的AI研发，一个强大的电脑配置是必不可少的。本文旨在为AI开发者提供一份详尽的电脑配置建议，帮助您在这个时代浪潮中占得先机。

# GPU云服务器 # 存储 # 人工智能 # 固态存储 # 开发者 # 异构计算

阿里云云原生

|

博文

|

来自：云原生

从云原生视角看 AI 原生应用架构的实践

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

# 微服务引擎 # 自然语言处理 # 云原生数据仓库 AnalyticDB PostgreSQL版 # GPU云服务器 # 负载均衡 # 人工智能 # Cloud Native # Java # API # 异构计算

奕晓凡

|

博文

|

来自：通义大模型

基于NVIDIA A30 加速卡推理部署通义千问-72B-Chat测试过程

本文介绍了基于阿里云通义千问72B大模型（Qwen-72B-Chat）的性能基准测试，包括测试环境准备、模型部署、API测试等内容。测试环境配置为32核128G内存的ECS云主机，配备8块NVIDIA A30 GPU加速卡。软件环境包括Ubuntu 22.04、CUDA 12.4.0、PyTorch 2.4.0等。详细介绍了模型下载、部署命令及常见问题解决方法，并展示了API测试结果和性能分析。

# GPU云服务器 # 缓存 # 自然语言处理 # 并行计算 # API # 异构计算

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

KTransformers：告别天价显卡！国产框架让单卡24G显存跑DeepSeek-R1 671B大模型：推理速度飙升28倍

KTransformers 是由清华大学和趋境科技联合推出的开源项目，能够优化大语言模型的推理性能，降低硬件门槛。支持在仅24GB显存的单张显卡上运行671B参数的满血版大模型。

# GPU云服务器 # 自然语言处理 # 存储 # 人工智能 # 并行计算 # API # 异构计算

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度，解决视频生成中的"遗忘"和"漂移"问题，仅需6GB显存即可在普通笔记本上实时生成高清视频。

# GPU云服务器 # 人工智能 # 并行计算 # Linux # 调度 # 异构计算

wljslmz

|

博文

CPU 和 GPU到底有啥区别？

【5月更文挑战第10天】

# GPU云服务器 # 机器学习/深度学习 # 存储 # 并行计算 # 开发者 # 异构计算

1744812029540769

|

博文

|

来自：大数据与机器学习

多GPU训练大型模型：资源分配与优化技巧｜英伟达将推出面向中国的改良芯片HGX H20、L20 PCIe、L2 PCIe

在人工智能领域，大型模型因其强大的预测能力和泛化性能而备受瞩目。然而，随着模型规模的不断扩大，计算资源和训练时间成为制约其发展的重大挑战。特别是在英伟达禁令之后，中国AI计算行业面临前所未有的困境。为了解决这个问题，英伟达将针对中国市场推出新的AI芯片，以应对美国出口限制。本文将探讨如何在多个GPU上训练大型模型，并分析英伟达禁令对中国AI计算行业的影响。

# 函数计算 # GPU云服务器 # 存储 # 人工智能 # 芯片 # 异构计算 # AI芯片

云流雨洄

|

9月前

|

博文

轻量级AI革命：无需GPU就能运算的DeepSeek-R1-1.5B模型及其低配部署指南

随着AI技术发展，大语言模型成为产业智能化的关键工具。DeepSeek系列模型以其创新架构和高效性能备受关注，其中R1-1.5B作为参数量最小的版本，适合资源受限场景。其部署仅需4核CPU、8GB RAM及15GB SSD，适用于移动对话、智能助手等任务。相比参数更大的R1-35B与R1-67B+，R1-1.5B成本低、效率高，支持数学计算、代码生成等多领域应用，是个人开发者和初创企业的理想选择。未来，DeepSeek有望推出更多小型化模型，拓展低资源设备的AI生态。

# GPU云服务器 # 存储 # 人工智能 # 固态存储 # 开发者 # 异构计算

云流雨洄

|

3月前

|

博文

服务器核心组件：CPU 与 GPU 的核心区别、应用场景、协同工作

CPU与GPU在服务器中各司其职：CPU擅长处理复杂逻辑，如订单判断、网页请求；GPU专注批量并行计算，如图像处理、深度学习。二者协同工作，能大幅提升服务器效率，满足多样化计算需求。

# GPU云服务器 # 机器学习/深度学习 # 数据库 # 数据安全/隐私保护 # 计算机视觉 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

GPU云服务器