《并行计算的编程模型》一2.6.5 MCS Locks示例

简介: 本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.6.5节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.6.5 MCS Locks示例

本节是最后一个示例,该示例展示了将部分的共享存储器算法转换到基于分布式存储器的AM实现的过程。该算法要解决的是MCS锁的锁获取函数[189]。本节只提供锁获取部分,我们鼓励读者自己进行初始化与锁释放操作。另外强烈建议读者阅读MCS锁相关论文,尤其是2.4节的算法5。理解共享内存实现机制对于学习该示例非常重要。
转换为C的MCS锁数据类型和共享内存的锁获取函数如代码清单2-6所示。
screenshot
在代码清单2-6中:
(1)lock数据类型为共享内存的链表头。
(2)qnode数据类型构成了链表的数据元素。
(3)qnode数据类型中包括一个locked字段,允许阻塞在锁获取时的线程在本地内存中轮询。
本例的主要目标是在分布式内存实现中重构这些属性,为此我们从数据类型的转换开始入手。如代码清单2-7所示。
screenshot
代码的第11~14行定义了两个“宽指针”类型,其中每个包括一个节点和一个地址。在lock_t和qnode_t类型的定义中,指向链表节点的指针已经替换为等价的“宽”指针。这是从共享内存到分布式内存转换中常用的术语。这两种类型的定义还包括“NEW”标识的字段,接下来将介绍其使用方法。
在进一步介绍MCS锁获取的转换前,我们向读者做一个简短的说明。本例是第一个必须让指针作为AM参数传递的示例。正如前文所述,GASNet AM的参数是无符号的32位整数。那么在传递64位指针的时候要作为两个参数。如果只考虑64位平台,那么可以使用简单的C预处理器宏实现这些。然而,同时为32位和64位平台编写易读的代码就需要使用C语言处理器实现。每个使用GASNet的客户端都有多个习惯用语版本,代码清单2-8提供了构建示例所需的三个AM处理程序的使用逻辑。在列表的宏定义中,采用双括号的参数列表Request2P和Reply2P1I不是很常见,其目的是确保C的预处理器能够以正确顺序执行其扩展。
screenshot
screenshot
我们再次回到代码清单2-6的共享内存C代码中,且重点关注第12行和第16行代码。这两行代码虽然只包含了原始算法中对非本地存储器的引用,但它们在AM中的实现构成了本例的核心内容,如代码清单2-9所示。
screenshot
当上一个值返回且相对于进行相同更新的其他线程执行原子性操作时,共享内存代码fetch_and_store()函数替换了调用者I的链表头。分布式存储器的这个操作由AM请求处理程序FetchAndStoreRequest及其相应的回复处理程序FetchAndStoreReply实现。通过GASNet处理程序安全锁满足原子性要求。在锁保护的临界区内,宽指针已有的值将保存在prev中并写入新值。因为节点部分(至少对于此算法)始终是请求的发送方,因此处理程序参数可以只传递新值的地址部分,节点部分可以通过gasnet_GetMsgSource获得。最后,FetchAndStoreRequest发送包含prev值(其中的节点部分为显式内容,因为可能是任何节点)的回复。
AM回复处理程序FetchAndStoreReply负责接收FetchAndStoreRequest请求应用程序发回的值。其中参数还包括在原始请求中传递的Ptr2值。这就允许回复处理程序识别相应的请求,并将“Fetched”值存储在正确的qnode_t变量的predecessor字段中。这种请求者上的地址来回传递在构造基于AM算法中十分常见,就像接收“return value”的预留空间一样(如添加在qnode_t类型的predecessor字段)。后续将在检查AcquireLock代码时解释gasnett_local_wmb()的调用。
代码清单2-9中的第三个AM处理程序是StoreNextRequest,主要用于实现共享内存版本算法的“predecessor->next = I”操作。这与FetchAndStoreReply函数十分相似,两者的区别在于写入的字段和节点数是以隐式形式传递的而不是参数形式,且StoreNextRequest处理程序不必进行回复。
最后,我们将和读者一起参考代码清单2-10实现AcquireLock。
screenshot
该部分代码遵循与带加法的共享存储器算法相同的步骤顺序。首先将调用者I初始化空的链表,且设置predecessor为“nil”。然后调用fetch-and-store的AM版本,并调用GASNET BLOCKUNTIL等待函数直至predecessor值不为“nil”。下一步是划分predecessor-> addr值,这里体现了GASNet工具gasnett_local_wmb()的重要性。该函数实现内存栅栏以确保在写入node字段前,对addr字段的写入是全局可见的。结合GASNET BLOCKUNTIL中对应的读取栅栏,此栅栏确保我们读取(node,addr)对的一致性,而无需互斥操作。
在对predecessor-> addr的值进行划分过程中,分布式存储器算法通过标记I为“locked”、将I的地址写入predecessor的next字段以及设置待清除的I->lock标记的方式,继续遵循共享存储器版本的逻辑操作。其中上述标记的清除操作是在尚未提供的LockRelease代码中完成的,同时我们也鼓励读者自己动手构建LockRelease以达到练习所学知识的目的。

相关文章
|
运维 监控 安全
【亮剑】为网络工程师总结了Juniper设备的配置、监控和故障排除命令
【4月更文挑战第30天】本文为网络工程师总结了Juniper设备的配置、监控和故障排除命令。配置命令包括基础设置、路由协议、安全和系统服务;监控命令涉及系统状态、接口、流量及路由表;故障排除命令涵盖日志、接口、路由协议和安全方面的排查工具。掌握这些基本命令将提升网络运维效率。
713 2
|
JavaScript Java 测试技术
基于SpringBoot+Vue的《学生手册》 线上考试系统的详细设计和实现
基于SpringBoot+Vue的《学生手册》 线上考试系统的详细设计和实现
150 1
|
弹性计算 虚拟化 异构计算
分享阿里云服务器GPU实例租用价格表明细
分享阿里云服务器GPU实例租用价格表明细,阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠,阿里云百科分享阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表
670 0
|
Java Spring 容器
【小家Spring】从OncePerRequestFilter的源码解读去了解Spring内置的Filter的特别之处以及常见过滤器使用介绍(上)
【小家Spring】从OncePerRequestFilter的源码解读去了解Spring内置的Filter的特别之处以及常见过滤器使用介绍(上)
【小家Spring】从OncePerRequestFilter的源码解读去了解Spring内置的Filter的特别之处以及常见过滤器使用介绍(上)
|
并行计算 API
《并行计算的编程模型》一2.5.1 GASNet工具
本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.5.1节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1122 1
|
Linux Unix Shell
带你读《面向Arduino用户的树莓派实用指南:物联网应用开发》之三:Linux基础
本书全面介绍了树莓派开发板的配置步骤、开发环境构建和实际应用技术,讲述了在树莓派上采用C++语言和库进行开发的方法,更为难得的是介绍了结合使用Arduino和树莓派的工具和流程。全书共分为13章,第1章为完成书中的项目提供了一份购物清单;第2章~第5章从硬件设置、操作系统安装和管理、树莓派上C++开发的流程和库等方面进行了介绍;第6章~第11章则采用实例的方式介绍了树莓派在多个方面的开发过程;第13章为总结和建议部分。本书适用于有意学习树莓派开发的读者,尤其适合具有Arduino经验的读者快速入门,也可作为STEAM教育的课程设计蓝本。
|
芯片 缓存 物联网
带你读《面向Arduino用户的树莓派实用指南:物联网应用开发》之一:采购清单
本书全面介绍了树莓派开发板的配置步骤、开发环境构建和实际应用技术,讲述了在树莓派上采用C++语言和库进行开发的方法,更为难得的是介绍了结合使用Arduino和树莓派的工具和流程。全书共分为13章,第1章为完成书中的项目提供了一份购物清单;第2章~第5章从硬件设置、操作系统安装和管理、树莓派上C++开发的流程和库等方面进行了介绍;第6章~第11章则采用实例的方式介绍了树莓派在多个方面的开发过程;第13章为总结和建议部分。本书适用于有意学习树莓派开发的读者,尤其适合具有Arduino经验的读者快速入门,也可作为STEAM教育的课程设计蓝本。
带你读《C/OS-III内核实现与应用开发实战指南:基于STM32》之二:裸机系统与多任务系统
本书分为两部分,第一部分先教你如何从0到1把uC/OS-III内核写出来,从底层的汇编开始讲解任务如何定义、如何切换,还讲解了阻塞延时如何实现、如何支持多优先级、如何实现任务延时列表以及时间片等uC/OS的核心知识点;第二部分讲解uC/OS-III内核组件的应用以及使用uC/OS-III进行多任务编程。
|
并行计算 API
《并行计算的编程模型》一3.1 引言
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.1节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1084 0
|
并行计算 算法
《并行计算的编程模型》一1.6 聚合通信
本节书摘来华章计算机《并行计算的编程模型》一书中的第1章 ,第1节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2237 0