《并行计算的编程模型》一3.7.1 选择集合参与者

简介: 本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.7.1节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.7.1 选择集合参与者

要参与一个集合操作,集合的每个成员必须调用具有相同源和目标参数的相同集合函数,并且每个成员必须指定相同的PE集参与集合。每个集合操作需要三个参数描述哪些PE将参与操作:初始PE、log2(PE_跨步)和参与PE的数目。因此,将这三个参数分别设为(0, 2, 6)意味着该集合操作将包含PE0、PE4、PE8、PE12、PE16和PE20,而(1, 0, 6)将包括PE1、PE2、PE3、PE4、PE5和PE6(当log2(PE_跨步)=0,跨步为1)。
识别重量级同步:在OpenSHMEM函数的调用序列中出现同步数组可以认为是出现重量级同步的指示器,这会在某些平台上对可扩展性有负面影响。此外,虽然参与PE数目不要求是2的幂,非2的幂对一些集合操作的实现会产生性能影响。最后,其他不需要同步数组的同步,包括全局同步屏障和对称分配函数。当需要这些函数时(或可以避免)加以仔细对待是利用OpenSHMEM提供的扩展性优势的关键。

相关文章
|
网络协议 NoSQL API
深入理解 RDMA 的软硬件交互机制
本文深入分析了RDMA技术在数据中心高性能网络环境下的工作原理及软硬件交互机制,通过对比传统Kernel TCP,突出了RDMA在减少延迟、提高系统性能方面的优势,同时讨论了其在内存管理、软硬交互方面的关键技术和挑战,为读者提供了全面理解RDMA技术及其应用场景的视角。
4783 8
|
机器学习/深度学习 虚拟化 异构计算
浅析GPU通信技术(上)-GPUDirect P2P
1. 背景 GPU在高性能计算和深度学习加速中扮演着非常重要的角色, GPU的强大的并行计算能力,大大提升了运算性能。随着运算数据量的不断攀升,GPU间需要大量的交换数据,GPU通信性能成为了非常重要的指标。
30736 1
|
云安全 弹性计算 运维
科普达人丨漫画图解什么是eRDMA?
绕过CPU,将数据直接从一台计算机的内存传输到另一台计算机,进行网络加速
科普达人丨漫画图解什么是eRDMA?
|
并行计算 算法
CUDA 的块间同步方法
CUDA 的块间同步方法
1579 0
|
并行计算
《并行计算的编程模型》一3.5 远程内存访问:put和get
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.5节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1203 0
|
并行计算 API
《并行计算的编程模型》一3.1 引言
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.1节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1108 0
|
并行计算 算法 API
《并行计算的编程模型》一导读
对于正在编程的程序员,编程模型可被看作一台虚拟机,并可通过编程语言和函数库实现。如果某个编程模型成为计算机科学研究中的热点,需要具有以下特性:高效性(易于描述各种抽象算法)、移植性(兼容各种硬件计算平台)、高性能(高效均衡地利用硬件平台的计算能力)、通用性(广泛地描述各种算法)。
3786 0
|
存储 并行计算
《并行计算的编程模型》一3.3 OpenSHMEM存储模型
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.3节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3484 0
|
并行计算 程序员
《并行计算的编程模型》一3.7.4 广播
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.7.4节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2489 0
|
并行计算 程序员
《并行计算的编程模型》一3.7.6 归约
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.7.6节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1115 0