openCL

首页 标签 openCL
# openCL #
关注
309内容
OpenCL 学习step by step (11) 数组求和(reduction)
本篇教程中,我们学习一下如何用opencl有效实现数组求和,也就是通常所说的reduction问题。      在程序中,我们设置workgroup size为256,kernel的输入、输出缓冲参数都用uint4的格式,这样我们原始求和的数组大小为256*4的倍数,数据类型为uint。
OpenCL 学习step by step (9) 灰度图Histogram计算(3)
在OpenCL编程中,特别是基于GPU的opencl的编程,提高程序性能最主要的方法就是想法提高memory的利用率,它主要包括两方面的优化:一方面是提高global memory的合并读写效率,另一方面就是减少local memory的bank conflict。
OpenCL 学习step by step (4) 读入二进制kernel文件
本教程中,我们使用上一篇教程中产生的二进制kernel文件vecadd.bin作为输入来创建程序对象,程序代码如下: //kernel文件为vecadd.bin gclFile kernelFile; if(!kernelFile.
AMD OpenCL大学课程(11)
性能优化 1、线程映射    所谓线程映射是指某个线程访问哪一部分数据,其实就是线程id和访问数据之间的对应关系。 合适的线程映射可以充分利用硬件特性,从而提高程序的性能,反之,则会降低性能。    请参考Static Memory Access Pattern Analysis on a Massively Parallel GPU这篇paper,文中讲述线程如何在算法中充分利用线程映射。
AMD OpenCL大学课程(2)
1、OpenCL架构       OpenCL可以实现混合设备的并行计算,这些设备包括CPU,GPU,以及其它处理器,比如Cell处理器,DSP等。使用OpenCL编程,可以实现可移植的并行加速代码。
Jpeg 库的解码OpenCL优化
libJpeg库解码OpenCL优化 这两周在闲暇时基于通用的libjpeg库重新做了一个opencl解码实现。重新熟悉下算法。 代码路径 https://github.com/jxt1234/platform_external_jpeg OpenCL文件夹目录下面的就是所有的修改。 用Xcode开发的,没兴趣去整Makefile了,代码独立,移植集成也很方便。
FFmpeg在Intel GPU上的硬件加速与优化
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/83572780 ...
免费试用