异构计算

首页 标签 异构计算
# 异构计算 #
关注
19441内容
|
1月前
|
TensorRT 和 ONNX Runtime 推理优化实战:10 个降低延迟的工程技巧
模型性能优化关键在于细节:固定输入形状、预热、I/O绑定、精度量化、图优化与CUDA Graph等小技巧,无需重构代码即可显著降低延迟。结合ONNX Runtime与TensorRT最佳实践,每个环节节省几毫秒,累积提升用户体验。生产环境实测有效,低延迟从此有据可依。
|
1月前
| |
来自: 弹性计算
现在选购阿里云服务器有哪些优惠政策?最新包年包月与按量付费优惠和活动价格参考
阿里云为用户准备了哪些云服务器购买优惠政策?不管是通过云服务器ECS产品详情页购买还是通过活动购买,用户都可以享受不同程度的优惠政策,本文为大家详细讲解现在选购阿里云服务器具体的包年包月和按量付费优惠政策,以及最新活动价格情况,以供大家选择参考。
哈希极化、拓扑盲点与拥塞抖动:主流端网协同方案如何缓解万卡集群通信瓶颈?
随着大模型参数规模迈向万亿级,万卡乃至十万卡 GPU 集群正成为 AI 训练基础设施的标配,而万卡集群三大通信瓶颈——哈希极化、拓扑盲点与拥塞抖动,对网络架构提出了前所未有的挑战。本文基于主流互联网大厂的公开实践,深入剖析超大规模集群中端网协同架构的设计思路,并探讨面向 MoE 与 DeepSeek 等新型模型的下一代 AI 网络演进方向。
裸机云与GPU性能深度解析:为何它是高性能计算的基石
在追求极致计算能力的今天,无论是复杂的人工智能模型训练、高精度科学模拟还是实时渲染,对GPU性能的压榨都达到了前所未有的程度。当企业在云上寻求强大的GPU算力时,一个关键的选择摆在面前:是选择传统的虚拟化云服务器,还是专为性能而生的裸机云?本文将深入探讨裸机云如何成为释放GPU全部潜能的终极平台。
|
1月前
| |
来自: 弹性计算
阿里云服务器按量付费优惠参考:GPU实例按量特惠0.9折,按量达标满50返50券介绍
阿里云服务器选择按量付费有优惠吗?当然有的,如果你是计划购买gpu云服务器,现在有指定GPU实例低至0.9折优惠!短期测试/小规模验证可选按量付费,前100小时低至0.9折。如果你是购买其他实例规格的云服务器也有“上云用按量,达标即返券”优惠,满10元返10元,满50元返50元,可直接抵扣云服务器订单!
为什么 OpenSearch 向量检索能提速 13 倍?
本文介绍在最新的 OpenSearch 实践中,引入 GPU 并行计算能力 与 NN-Descent 索引构建算法,成功将亿级数据规模下的向量索引构建速度提升至原来的 13 倍。
|
1月前
|
毅硕HPC | Rocky Linux 9 SLURM软件编译安装
Slurm 是现代HPC集群不可或缺的核心中间件。通过本教程,您将学习如何在 Rocky Linux 9 系统上从源码编译并安装配置这一强大的调度系统,为构建您自己的高性能计算环境奠定坚实的基础。
免费试用