GPGPU OpenCL使用结构体数据

简介: OpenCL编程中可以使用结构体,只需要在核函数kernel中提供同样的结构体申明就可以啦。  如果在主函数中定义了结构体: 1 typedef struct studentNode{ 2 int age; 3 float height; 4 }student; ...

OpenCL编程中可以使用结构体,只需要在核函数kernel中提供同样的结构体申明就可以啦。

 如果在主函数中定义了结构体:

1 typedef struct studentNode{
2     int age;
3     float height;
4 }student;

 主函数中定义数据,并传输给OpenCL kernel:

 1     student *stu_input=(student*)malloc(sizeof(studentNode));
 2     stu_input->age=25;
 3     stu_input->height=1.8l;
 4     student *stu_output=(student*)malloc(sizeof(studentNode));
 5 
 6     cl_mem inputBuffer = clCreateBuffer(context, CL_MEM_READ_ONLY|CL_MEM_COPY_HOST_PTR, sizeof(studentNode),(void *)stu_input, NULL);
 7     cl_mem outputBuffer = clCreateBuffer(context, CL_MEM_WRITE_ONLY ,sizeof(studentNode), NULL, NULL);
 8 
 9     cl_kernel kernel = clCreateKernel(program,"structTest", NULL);
10 
11     status = clSetKernelArg(kernel, 0, sizeof(cl_mem), (void *)&inputBuffer);
12     status = clSetKernelArg(kernel, 1, sizeof(cl_mem), (void *)&outputBuffer);

下面是具体的OpenCL kernel,可以对学生的年龄、身高进行修改:

 1 typedef struct studentNode{
 2     int age;
 3     float height;
 4 }student;
 5 
 6 int growUp(__global student *stu_input ,__global student *stu_output)
 7 {
 8     stu_output->age=stu_input->age+1;
 9     stu_output->height=stu_input->height + 0.1;
10     return 0;
11 }
12 
13 __kernel void structTest(__global student *stu_input ,__global student *stu_output)
14 {
15     growUp(stu_input,stu_output);
16 }

执行输出:

注意:

  OpenCL中不支持字符串,如char string[32]="Hello World"。OpenCL不能确定字符串中有多少个有效字符,必须给定字符数量。

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
9天前
|
人工智能 C++
AnythingLLM vs Cherry Studio vs Chatbox:三大AI工具深度横评
本文深入对比三大AI工具:AnythingLLM、Cherry Studio与Chatbox。从易用性、功能丰富度、RAG能力、多模态支持到知识库管理,全面分析各工具优劣,并结合企业知识管理、个人创作学习等场景提供选型指南。最终指出:选择不在于“最好”,而在于“最合适”——AnythingLLM适合企业级知识体系构建,Cherry Studio助力多模态内容创作,Chatbox则以极简体验满足日常对话需求。
|
4月前
|
人工智能 自然语言处理 搜索推荐
提示词工程师到底是干什么的?
从小张想让AI助手帮他写代码却总是得到奇怪答案说起,揭开提示词工程师这个神秘职业的面纱。这个被称为'AI翻译官'的工作到底有多香?是时候考虑转行了吗?
|
数据挖掘 Python
🚀告别繁琐!Python I/O管理实战,文件读写效率飙升的秘密
在日常编程中,高效的文件I/O管理对提升程序性能至关重要。Python通过内置的`open`函数及丰富的库简化了文件读写操作。本文从基本的文件读写入手,介绍了使用`with`语句自动管理文件、批量读写以减少I/O次数、调整缓冲区大小、选择合适编码格式以及利用第三方库(如pandas和numpy)等技巧,帮助你显著提升文件处理效率,让编程工作更加高效便捷。
248 0
|
开发者 图形学 前端开发
绝招放送:彻底解锁Unity UI系统奥秘,五大步骤教你如何缔造令人惊叹的沉浸式游戏体验,从Canvas到动画,一步一个脚印走向大师级UI设计
【8月更文挑战第31天】随着游戏开发技术的进步,UI成为提升游戏体验的关键。本文探讨如何利用Unity的UI系统创建美观且功能丰富的界面,包括Canvas、UI元素及Event System的使用,并通过具体示例代码展示按钮点击事件及淡入淡出动画的实现过程,助力开发者打造沉浸式的游戏体验。
733 0
|
机器学习/深度学习 人工智能 前端开发
转载:【AI系统】AI编译器前瞻
本文基于《The Deep Learning Compiler: A Comprehensive Survey》调研,对比了TVM、nGraph、TC、Glow和XLA五个热门AI编译器,介绍了它们的特点与优势。文章还探讨了AI编译器面临的挑战,如动态Shape问题、Python编译静态化、硬件性能优化等,并展望了AI编译器的未来发展方向,包括自动并行、自动微分和Kernel自动生成等技术。
转载:【AI系统】AI编译器前瞻
|
开发框架 监控 前端开发
知识库系统|基于springboot的课程知识库系统设计与实现
知识库系统|基于springboot的课程知识库系统设计与实现
562 0
|
人工智能
当你拥有一个AI助理时,可以做什么?ChatGLM2-6B
当你拥有一个AI助理时,可以做什么?ChatGLM2-6B
327 2
|
存储 分布式计算 网络协议
文件上传下载系列——大文件分片上传
文件上传下载系列——大文件分片上传
|
Shell
【P4】解决本地文件修改与库文件间的冲突问题
【P4】解决本地文件修改与库文件间的冲突问题
1223 0
【P4】解决本地文件修改与库文件间的冲突问题
|
SQL 存储 机器学习/深度学习
分布式系统开发实战:分布式计算,分布式计算常用技术
分布式计算就是将一个大的计算任务分解成多个小任务,然后分配给多台计算机分别计算,再上传运算结果后统一合并得出数据结论。本章详细介绍分布式计算。