这个函数NVCC是NVIDIA Cuda编译器NVCC.exe的包装器
与Visual Studio编译器结合使用。在这个CUDA之后
文件可以被编译成内核
如果你第一次调用代码,或者使用“nvcc -config”:
1)它将尝试定位“NVIDIA GPU计算工具包”
可从www.nvidia.com/object/cuda_get.html
典型的位置:
C:\Program Files\NVIDIA GPU计算工具包CUDA v3.2\bin
2)它将尝试定位visual studio编译器
典型的位置:
C:\Program Files (x86)\Microsoft Visual Studio 9.0\VC\bin\
3)使用编译器信息创建一个文件nvccbat.bat。
完成此配置过程后,您可以使用以下方法编译文件:
学校网站(文件名);
或者
学校网站(选项,文件名)
文件名:带有文件名的字符串,例如“example.cu”
选项:例如NVCC编译器选项,
学校网站(option1 option2 option3,文件名)
有关NVCC配置选项类型的帮助,“NVCC——help”
注意!
如果NVCC无法找到编译器,您可以尝试
在文本编辑器中编写你自己的"nvccbat.bat"文件,例如:
呼应了
set PATH=C: Program Files (x86)\Microsoft Visual Studio 9.0\VC\bin\
set PATH=C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v3.2\bin
叫vcvars32.bat
NVCC 1 2 3 4 5 6 7 8 9
1例,配置
定位Cuda和VS编译器
nvcc -config
显示NVCC编译器选项
学校网站,帮助
测试一些输入选项
NVCC——dryrun -ptx example.cu
2例,
定位Cuda和VS编译器
nvcc -config
编译代码
nvcc('example.cu');
就像:
nvcc -ptx example.cu
使内核
kernel = parallel.gpu.cudakernel('example.ptx','example.cu');
我们想要执行这个内核100次
Kernel.ThreadBlockSize = 100;
我们制作一个带有100个随机文件的数组
Data =兰德(100,“单”);
DataCuda = gpuArray(数据);
我们将值加上1
OneCuda = parallel.gpu.GPUArray.ones (1,1);
执行内核
dataonecuda = feval(内核,datacuda,oneCuda);
获取数据
DataOne =收集(DataOneCuda);
显示结果
图,等等;
情节(数据,b);
情节(DataOne ' r ');
引用作为
Dirk-Jan克朗(2021)。NVCC cuda编译器包装(//www.tianjin-qmedu.com/matlabcentral/fileexchange/29611-nvcc-cuda-compiler-wraper), MATLAB中央文件交换。检索.