《OpenACC并行程序设计:性能优化实践指南》一 3.2 逐步性能提升

简介: 本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.2节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.2 逐步性能提升

本书的示例表明,通过提交更多的活动和优化数据传输,使用性能分析驱动的开发可不断提升OpenACC应用程序的性能。图3-2列出了优化混合应用遵循的模式。

screenshot

从应用准备开始性能优化周期,然后进行实际的性能测量,并对性能数据进行分析。基于这些数据,编程开发人员尝试减少性能问题,并重新开始整个过程。
下面使用Score-P和Vampri讲解性能提升周期里的前三步,以CUDA加速粒子单元模拟为例,其中CUDA部分代码很容易用OpenACC实现代替来获得同样的结果。此外,还引入了各种优化步骤,突出了更普遍适用的性能调优选项。

相关文章
|
NoSQL 关系型数据库 API
python常用库汇总(下)
python常用库汇总(下)
315 0
|
缓存 NoSQL Shell
MongoDB系列-在复制集(replication)以及分片(Shard)中创建索引
在使用MongoDB时,在创建索引会涉及到在复制集(replication)以及分片(Shard)中创建,为了最大限度地减少构建索引的影响,在副本和分片中创建索引,使用滚动索引构建过程。
717 0
|
数据管理 大数据 OLAP
AnalyticDB核心概念详解:表、索引与分区
【10月更文挑战第25天】在大数据时代,高效的数据库管理和分析工具变得尤为重要。阿里云的AnalyticDB(ADB)是一款完全托管的实时数据仓库服务,能够支持PB级数据的实时查询和分析。作为一名数据工程师,我有幸在多个项目中使用过AnalyticDB,并积累了丰富的实践经验。本文将从我个人的角度出发,详细介绍AnalyticDB的核心概念,包括表结构设计、索引类型选择和分区策略,帮助读者更有效地组织和管理数据。
540 3
|
消息中间件 测试技术 Python
Python使用多线程解析超大日志文件
Python使用多线程解析超大日志文件
422 0
|
SQL Cloud Native 关系型数据库
云原生数据仓库使用问题之分组优化如何实现
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
SQL 存储
6. 复杂查询
6. 复杂查询
第1章 MATLAB R2020a概述——1.6 MATLAB帮助系统
第1章 MATLAB R2020a概述——1.6 MATLAB帮助系统
|
SQL XML 存储
Flowable 任务如何认领,回退?
Flowable 任务如何认领,回退?
|
自然语言处理 编译器 开发者
|
设计模式 Rust JavaScript
前端周刊第三十二期
前端周刊发表每周前端技术相关的大事件、文章教程、一些框架的版本更新、以及代码和工具。每周定期发表,欢迎大家关注、转载。
前端周刊第三十二期