《OpenACC并行程序设计:性能优化实践指南》一 第2章 性能导向开发

简介: 本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第2章,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第2章

性能导向开发
Jeff Larkin
美国加利福尼亚州圣克拉拉县NVIDIA公司
本章的目的是通过一个性能测试应用的加速来初步了解OpenACC编程方法。读者将学习如何添加OpenACC导语以及如何进行代码性能调优,进而逐步提升应用的性能。本章最后,示例程序将从串行代码改进为高性能并行代码。该并行代码可以运行在图形处理器(GPU)加速器和多核处理器(CPU)上。
阅读本章后,读者将会理解以下内容:
OpenACC内核指令
OpenACC数据指令和子句
PGProf性能调试器的使用
OpenACC标准三层并行模型
数据依赖
形如OpenACC之类的编译器导语是对标准编程语言的扩展,可以在较高的层次向编译器传达一系列显式信息。例如,OpenACC提供了显式表达循环并行特性和分离式物理存储器间数据移动的机制,传统的C、C++或Fortran编程语言均不具备这一能力。而OpenACC与这些传统编程语言良好耦合,恰好完美地补充了它们的不足之处。程序员通常逐步地向现存代码添加导语,优先向加速“热点”函数和循环应用导语,之后再改进其他次要代码部分。性能导向开发是一种利用性能分析工具指引程序员逐步改善程序性能的技术。性能导向开发能够告知程序员应用代码中哪部分加速后能够获得更大的性能提升。本章中,使用PGI(The Portland Group)编译器和PGPROF性能分析工具对一段测试代码进行逐步加速与改进。本章最后,将对一系列测试代码进行并行化。这里,完全使用OpenACC完成这些任务。
完成本章所需要的前提条件:一套可以运行和生成可执行程序的OpenACC编译器(本章中的示例将使用NVIDIA OpenACC开发包);读者需要能够阅读、理解并编译C或Fortran代码;读者需要能够运行OpenACC编译器生成的可执行程序。

相关文章
|
缓存 JavaScript
vue 页面缓存 keep-alive(含配置清除页面缓存 exclude,局部缓存,动态缓存,路由控制缓存 $route.meta.keepAlive)
vue 页面缓存 keep-alive(含配置清除页面缓存 exclude,局部缓存,动态缓存,路由控制缓存 $route.meta.keepAlive)
2140 0
|
存储 弹性计算 大数据
阿里云服务器是什么?优势、功能和应用场景详细介绍
阿里云服务器是什么?优势、功能和应用场景详细介绍,云服务器租用价格、云服务器使用场景及限制说明,阿里云服务器网分享云服务器ECS介绍、个人和企业免费试用、云服务器活动、云服务器ECS规格、优势、功能及应用场景详细说明
2406 0
|
5天前
|
人工智能 JSON 监控
Claude Code 源码泄露:一份价值亿元的 AI 工程公开课
我以为顶级 AI 产品的护城河是模型。读完这 51.2 万行泄露的源码,我发现自己错了。
4049 12
|
16天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
11632 137
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
4天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
1419 7
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
6天前
|
人工智能 自然语言处理 数据挖掘
零基础30分钟搞定 Claude Code,这一步90%的人直接跳过了
本文直击Claude Code使用痛点,提供零基础30分钟上手指南:强调必须配置“工作上下文”(about-me.md+anti-ai-style.md)、采用Cowork/Code模式、建立标准文件结构、用提问式提示词驱动AI理解→规划→执行。附可复制模板与真实项目启动法,助你将Claude从聊天工具升级为高效执行系统。
|
5天前
|
人工智能 定位技术
Claude Code源码泄露:8大隐藏功能曝光
2026年3月,Anthropic因配置失误致Claude Code超51万行源码泄露,意外促成“被动开源”。代码中藏有8大未发布功能,揭示其向“超级智能体”演进的完整蓝图,引发AI编程领域震动。(239字)
2323 9

热门文章

最新文章