VS2017中嵌入CUDA编程的一些坑

简介: VS2017中嵌入CUDA编程的一些坑

最近再看深度学习的时候,了解了一些CUDA和GPU编程的东西,于是便想着用自己熟悉的C++试一试GPU编程的乐趣,然后遇到了一些小坑,在此记录一些。


首先分享一个 CUDA安装的教程,之后开始填坑。  



一、First 坑–“应输入表达式”


在调用核函数时,需要用到三重括号<<<>>>,但是在c/c++语法中,没有这种语法,所以自然会报这个错误,错误截图如下所示:

4234effe02514b78b37d6d3e3ba3755c.png

这个错误无论将代码放在.cu文件中,还是放在.cpp文件中,都会出现,解决方法是:将源文件→属性→常规中的“项类型”改为CUDA C/C++

48473bc99d5144d1a8ef6973e6282b67.png

需要注意的是,改完之后,在代码界面仍会有报错提示,但是编译和运行代码已经不受影响了,有强迫症的小伙伴可以试试其他方式




二、Second 坑–程序不进入核函数


这个问题有两种可能性,第一种可能为下载的CUDA版本和电脑中的GPU版本不匹配,这样需要对照自己的GPU算力下载对应算力的CUDA;


第二种可能是当前VS中CUDA的配置不对!!!那我们需要项目→属性→CUDA C/C++→Device→Code Generation,将后边的数字修改为自己GPU的算力。


a934c860e28b4c718fd8e8065eeb623d.png



3、Hello world测试


#include<stdio.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>
__global__ void kernal()
{
  printf("\nhello from GPUn");
}
int main()
{
  printf("hello from CPUn");
  kernal << <1, 5 >> > ();//调用GPU中的5个线程
  cudaError_t cudaStatus = cudaGetLastError();
  if (cudaStatus != cudaSuccess)
  {
    fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus));
  }
  cudaDeviceReset();
  return 0;
}

若没有其他问题,粘贴上述代码可以输入的结果如下所示:



f40793dc97f24c6a9132fe086788e604.png


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
10月前
|
PyTorch 算法框架/工具
Bert PyTorch 源码分析:一、嵌入层
Bert PyTorch 源码分析:一、嵌入层
101 0
|
7月前
|
机器学习/深度学习 边缘计算 PyTorch
PyTorch 与 ONNX:模型的跨平台部署策略
【8月更文第27天】深度学习模型的训练通常是在具有强大计算能力的平台上完成的,比如配备有高性能 GPU 的服务器。然而,为了将这些模型应用到实际产品中,往往需要将其部署到各种不同的设备上,包括移动设备、边缘计算设备甚至是嵌入式系统。这就需要一种能够在多种平台上运行的模型格式。ONNX(Open Neural Network Exchange)作为一种开放的标准,旨在解决模型的可移植性问题,使得开发者可以在不同的框架之间无缝迁移模型。本文将介绍如何使用 PyTorch 将训练好的模型导出为 ONNX 格式,并进一步探讨如何在不同平台上部署这些模型。
622 2
|
7月前
|
机器学习/深度学习 算法
编译DNN模型
【8月更文挑战第9天】编译DNN模型。
54 1
|
8月前
|
机器学习/深度学习 TensorFlow API
Keras是一个高层神经网络API,由Python编写,并能够在TensorFlow、Theano或CNTK之上运行。Keras的设计初衷是支持快速实验,能够用最少的代码实现想法,并且能够方便地在CPU和GPU上运行。
Keras是一个高层神经网络API,由Python编写,并能够在TensorFlow、Theano或CNTK之上运行。Keras的设计初衷是支持快速实验,能够用最少的代码实现想法,并且能够方便地在CPU和GPU上运行。
|
10月前
|
机器学习/深度学习 数据采集 PyTorch
构建你的第一个PyTorch神经网络模型
【4月更文挑战第17天】本文介绍了如何使用PyTorch构建和训练第一个神经网络模型。首先,准备数据集,如MNIST。接着,自定义神经网络模型`SimpleNet`,包含两个全连接层和ReLU激活函数。然后,定义交叉熵损失函数和SGD优化器。训练模型涉及多次迭代,计算损失、反向传播和参数更新。最后,测试模型性能,计算测试集上的准确率。这是一个基础的深度学习入门示例,为进一步探索复杂项目打下基础。
|
10月前
|
机器学习/深度学习 PyTorch 算法框架/工具
PyTorch深度学习基础之Tensor对象及其应用的讲解及实战(附源码 简单易懂 包括分段 映射 矩阵乘法 随机数等等)
PyTorch深度学习基础之Tensor对象及其应用的讲解及实战(附源码 简单易懂 包括分段 映射 矩阵乘法 随机数等等)
108 1
|
机器学习/深度学习 PyTorch 算法框架/工具
Pytorch基础模块一模型(1)
Pytorch基础模块一模型(1)
137 0
|
并行计算 PyTorch 测试技术
PyTorch 之 简介、相关软件框架、基本使用方法、tensor 的几种形状和 autograd 机制-2
由于要进行 tensor 的学习,因此,我们先导入我们需要的库。
|
机器学习/深度学习 人工智能 自然语言处理
PyTorch 之 简介、相关软件框架、基本使用方法、tensor 的几种形状和 autograd 机制-1
PyTorch 是一个基于 Torch 的 Python 开源机器学习库,用于自然语言处理等应用程序。它主要由 Facebook 的人工智能小组开发,不仅能够实现强大的 GPU 加速,同时还支持动态神经网络,这一点是现在很多主流框架如 TensorFlow 都不支持的。
|
并行计算 开发工具 vr&ar