《并行计算的编程模型》一2.6.5 MCS Locks示例

简介: 本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.6.5节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.6.5 MCS Locks示例

本节是最后一个示例,该示例展示了将部分的共享存储器算法转换到基于分布式存储器的AM实现的过程。该算法要解决的是MCS锁的锁获取函数[189]。本节只提供锁获取部分,我们鼓励读者自己进行初始化与锁释放操作。另外强烈建议读者阅读MCS锁相关论文,尤其是2.4节的算法5。理解共享内存实现机制对于学习该示例非常重要。
转换为C的MCS锁数据类型和共享内存的锁获取函数如代码清单2-6所示。
screenshot
在代码清单2-6中:
(1)lock数据类型为共享内存的链表头。
(2)qnode数据类型构成了链表的数据元素。
(3)qnode数据类型中包括一个locked字段,允许阻塞在锁获取时的线程在本地内存中轮询。
本例的主要目标是在分布式内存实现中重构这些属性,为此我们从数据类型的转换开始入手。如代码清单2-7所示。
screenshot
代码的第11~14行定义了两个“宽指针”类型,其中每个包括一个节点和一个地址。在lock_t和qnode_t类型的定义中,指向链表节点的指针已经替换为等价的“宽”指针。这是从共享内存到分布式内存转换中常用的术语。这两种类型的定义还包括“NEW”标识的字段,接下来将介绍其使用方法。
在进一步介绍MCS锁获取的转换前,我们向读者做一个简短的说明。本例是第一个必须让指针作为AM参数传递的示例。正如前文所述,GASNet AM的参数是无符号的32位整数。那么在传递64位指针的时候要作为两个参数。如果只考虑64位平台,那么可以使用简单的C预处理器宏实现这些。然而,同时为32位和64位平台编写易读的代码就需要使用C语言处理器实现。每个使用GASNet的客户端都有多个习惯用语版本,代码清单2-8提供了构建示例所需的三个AM处理程序的使用逻辑。在列表的宏定义中,采用双括号的参数列表Request2P和Reply2P1I不是很常见,其目的是确保C的预处理器能够以正确顺序执行其扩展。
screenshot
screenshot
我们再次回到代码清单2-6的共享内存C代码中,且重点关注第12行和第16行代码。这两行代码虽然只包含了原始算法中对非本地存储器的引用,但它们在AM中的实现构成了本例的核心内容,如代码清单2-9所示。
screenshot
当上一个值返回且相对于进行相同更新的其他线程执行原子性操作时,共享内存代码fetch_and_store()函数替换了调用者I的链表头。分布式存储器的这个操作由AM请求处理程序FetchAndStoreRequest及其相应的回复处理程序FetchAndStoreReply实现。通过GASNet处理程序安全锁满足原子性要求。在锁保护的临界区内,宽指针已有的值将保存在prev中并写入新值。因为节点部分(至少对于此算法)始终是请求的发送方,因此处理程序参数可以只传递新值的地址部分,节点部分可以通过gasnet_GetMsgSource获得。最后,FetchAndStoreRequest发送包含prev值(其中的节点部分为显式内容,因为可能是任何节点)的回复。
AM回复处理程序FetchAndStoreReply负责接收FetchAndStoreRequest请求应用程序发回的值。其中参数还包括在原始请求中传递的Ptr2值。这就允许回复处理程序识别相应的请求,并将“Fetched”值存储在正确的qnode_t变量的predecessor字段中。这种请求者上的地址来回传递在构造基于AM算法中十分常见,就像接收“return value”的预留空间一样(如添加在qnode_t类型的predecessor字段)。后续将在检查AcquireLock代码时解释gasnett_local_wmb()的调用。
代码清单2-9中的第三个AM处理程序是StoreNextRequest,主要用于实现共享内存版本算法的“predecessor->next = I”操作。这与FetchAndStoreReply函数十分相似,两者的区别在于写入的字段和节点数是以隐式形式传递的而不是参数形式,且StoreNextRequest处理程序不必进行回复。
最后,我们将和读者一起参考代码清单2-10实现AcquireLock。
screenshot
该部分代码遵循与带加法的共享存储器算法相同的步骤顺序。首先将调用者I初始化空的链表,且设置predecessor为“nil”。然后调用fetch-and-store的AM版本,并调用GASNET BLOCKUNTIL等待函数直至predecessor值不为“nil”。下一步是划分predecessor-> addr值,这里体现了GASNet工具gasnett_local_wmb()的重要性。该函数实现内存栅栏以确保在写入node字段前,对addr字段的写入是全局可见的。结合GASNET BLOCKUNTIL中对应的读取栅栏,此栅栏确保我们读取(node,addr)对的一致性,而无需互斥操作。
在对predecessor-> addr的值进行划分过程中,分布式存储器算法通过标记I为“locked”、将I的地址写入predecessor的next字段以及设置待清除的I->lock标记的方式,继续遵循共享存储器版本的逻辑操作。其中上述标记的清除操作是在尚未提供的LockRelease代码中完成的,同时我们也鼓励读者自己动手构建LockRelease以达到练习所学知识的目的。

相关文章
|
运维 监控 安全
【亮剑】为网络工程师总结了Juniper设备的配置、监控和故障排除命令
【4月更文挑战第30天】本文为网络工程师总结了Juniper设备的配置、监控和故障排除命令。配置命令包括基础设置、路由协议、安全和系统服务;监控命令涉及系统状态、接口、流量及路由表;故障排除命令涵盖日志、接口、路由协议和安全方面的排查工具。掌握这些基本命令将提升网络运维效率。
844 2
|
JavaScript Java 测试技术
基于SpringBoot+Vue的《学生手册》 线上考试系统的详细设计和实现
基于SpringBoot+Vue的《学生手册》 线上考试系统的详细设计和实现
175 1
|
弹性计算 虚拟化 异构计算
分享阿里云服务器GPU实例租用价格表明细
分享阿里云服务器GPU实例租用价格表明细,阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠,阿里云百科分享阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表
877 0
|
Java Spring 容器
【小家Spring】从OncePerRequestFilter的源码解读去了解Spring内置的Filter的特别之处以及常见过滤器使用介绍(上)
【小家Spring】从OncePerRequestFilter的源码解读去了解Spring内置的Filter的特别之处以及常见过滤器使用介绍(上)
【小家Spring】从OncePerRequestFilter的源码解读去了解Spring内置的Filter的特别之处以及常见过滤器使用介绍(上)
|
5天前
|
人工智能 JSON 监控
Claude Code 源码泄露:一份价值亿元的 AI 工程公开课
我以为顶级 AI 产品的护城河是模型。读完这 51.2 万行泄露的源码,我发现自己错了。
4130 15
|
16天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
11662 138
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
4天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
1434 7
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
6天前
|
人工智能 自然语言处理 数据挖掘
零基础30分钟搞定 Claude Code,这一步90%的人直接跳过了
本文直击Claude Code使用痛点,提供零基础30分钟上手指南:强调必须配置“工作上下文”(about-me.md+anti-ai-style.md)、采用Cowork/Code模式、建立标准文件结构、用提问式提示词驱动AI理解→规划→执行。附可复制模板与真实项目启动法,助你将Claude从聊天工具升级为高效执行系统。

热门文章

最新文章