《OpenACC并行程序设计:性能优化实践指南》一 3.2 逐步性能提升

简介: 本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.2节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.2 逐步性能提升

本书的示例表明,通过提交更多的活动和优化数据传输,使用性能分析驱动的开发可不断提升OpenACC应用程序的性能。图3-2列出了优化混合应用遵循的模式。

screenshot

从应用准备开始性能优化周期,然后进行实际的性能测量,并对性能数据进行分析。基于这些数据,编程开发人员尝试减少性能问题,并重新开始整个过程。
下面使用Score-P和Vampri讲解性能提升周期里的前三步,以CUDA加速粒子单元模拟为例,其中CUDA部分代码很容易用OpenACC实现代替来获得同样的结果。此外,还引入了各种优化步骤,突出了更普遍适用的性能调优选项。

相关文章
|
NoSQL 关系型数据库 API
python常用库汇总(下)
python常用库汇总(下)
367 0
|
数据管理 大数据 OLAP
AnalyticDB核心概念详解:表、索引与分区
【10月更文挑战第25天】在大数据时代,高效的数据库管理和分析工具变得尤为重要。阿里云的AnalyticDB(ADB)是一款完全托管的实时数据仓库服务,能够支持PB级数据的实时查询和分析。作为一名数据工程师,我有幸在多个项目中使用过AnalyticDB,并积累了丰富的实践经验。本文将从我个人的角度出发,详细介绍AnalyticDB的核心概念,包括表结构设计、索引类型选择和分区策略,帮助读者更有效地组织和管理数据。
621 3
|
消息中间件 测试技术 Python
Python使用多线程解析超大日志文件
Python使用多线程解析超大日志文件
476 0
|
索引
ENVI_IDL:如何读取HDF4数据?
ENVI_IDL:如何读取HDF4数据?
350 0
|
SQL Cloud Native 关系型数据库
云原生数据仓库使用问题之分组优化如何实现
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
第1章 MATLAB R2020a概述——1.6 MATLAB帮助系统
第1章 MATLAB R2020a概述——1.6 MATLAB帮助系统
|
自然语言处理 编译器 开发者
|
SQL XML 存储
Flowable 任务如何认领,回退?
Flowable 任务如何认领,回退?
1068 0
|
传感器 缓存 算法
基于uFUN开发板的心率计(二)动态阈值算法获取心率值
基于uFUN开发板的心率计(二)动态阈值算法获取心率值
268 0
基于uFUN开发板的心率计(二)动态阈值算法获取心率值
|
机器学习/深度学习 人工智能 算法
对人胜率84%,DeepMind AI首次在西洋陆军棋中达到人类专家水平
对人胜率84%,DeepMind AI首次在西洋陆军棋中达到人类专家水平
336 0

热门文章

最新文章