主要内容

GPU环境检查和设置应用程序

GPU环境检查应用程序是一个交互式工具,可在开发计算机和嵌入式硬件平台上验证和设置GPU代码生成环境,如nvidia®开车和杰森。

要启动应用程序,请在MATLAB中®命令窗口,输入:

gpucodersetup.
使用GPU环境检查应用程序,您可以:

  • 验证GPU代码生成所需的NVIDIA编译器和库的主机开发计算机环境。

  • 执行基本代码生成并测试主计算机中GPU设备上生成的代码的执行。测试通过将结果与MATLAB仿真进行比较来验证代码执行。

  • 对开发计算机执行深度学习代码生成和执行测试。您可以针对NVIDIA CUDNN或RensorRT库。需要这一点用于深度学习库的GPU编码器™接口万博1manbetx支持包。

  • 连接到嵌入式NVIDIA板,如驱动器和Jetson以执行代码生成和执行测试。需要这一点GPU编码器支持NV万博1manbetxIDIA GPU的包

  • 指定库的位置并生成MATLAB脚本,该脚本设置GPU编码器所需的环境变量。

注意

gpucodersetup.应用程序在当前文件夹中生成报表文件。如果在运行应用程序之前没有当前文件夹中的写权限,请使用MATLAB更改文件夹光盘命令。

样本屏幕截图GPU环境检查应用程序

硬件设置

检查/设置应用程序面板提供了下拉列表,使您可以在主机开发计算机或硬件平台上选择GPU设备,例如NVIDIA驱动器和Jetson。

选项 价值 描述

选择硬件

主机(对于mex)

对主机开发计算机执行代码生成,代码执行和环境检查。该应用程序生成CUDA®MEX进行测试。

如果您的开发计算机有多个GPU设备,请使用选择GPU.选择适当的GPU设备的选项。

驾驶

在NVIDIA驱动器目标平台上执行代码生成和代码执行检查。

安装后GPU编码器支持NV万博1manbetxIDIA GPU的包, 使用板设置面板为目标指定连接参数。

杰森

在NVIDIA Jetson目标平台上执行代码生成和代码执行检查。

安装后GPU编码器支持NV万博1manbetxIDIA GPU的包, 使用板设置面板为目标指定连接参数。

选择GPU.

GPU -<设备名称>

选择GPU设备以运行测试。当有多个设备时,第一设备是默认值。

只有当何时可见此选项选择硬件选项设置为主机(对于mex)。对于驱动器或Jetson硬件,使用GPU设备ID选项可用板设置面板选择特定的GPU设备。

板设置

指定硬件平台的连接参数,例如NVIDIA驱动器和Jetson。该应用程序使用杰森(GPU编码器支持NV万博1manbetxIDIA GPU的包)要么驾驶(GPU编码器支持NV万博1manbetxIDIA GPU的包)函数的GPU编码器支持NV万博1manbetxIDIA GPU的包创建实时硬件连接对象。支持包软万博1manbetx件使用TCP / IP上的SSH连接在构建和运行驱动器或Jetson平台上运行生成的CUDA代码时执行命令。目标平台必须与主计算机相同的网络。或者,您可以使用以太网交叉电缆将电路板直接连接到主机。有关NVIDIA板的要求,设置和配置步骤的更多信息,请参阅安装和设置NVIDIA板的先决条件(GPU编码器支持NV万博1manbetxIDIA GPU的包)

选项 描述

设备地址

硬件的IP地址或主机名。

例如,169.254.0.2要么GPUCODER-TEGRATX2-1

要使用主机名,必须将以太网电缆连接到电路板的以太网端口。然后,使用Linux命令配置硬件IP地址并将主机名与IP地址相关联。

用户名

有效的Linux®用户在电路板上的操作系统的用户名。

密码

指定Linux用户名的有效密码。

执行超时

在验证目标上验证执行之前,请指定应用程序等待的时间以秒为单位。默认值为10秒。

GPU设备ID

在多GPU环境(如NVIDIA Drive Platforms)中,将CUDA GPU设备指定为目标。

工作流程检查

使用应用程序可以执行两种类型的工作流检查:

开发计算机上的基本代码生成和执行测试。这些测试通过将结果与MATLAB仿真进行比较来验证代码执行。

选项 描述

生成代码

测试基本代码生成和建筑物。此测试需要在指定的硬件上有效的CUDA代码生成环境。

生成代码并执行

测试基本代码生成,构建和在设备上执行指定的硬件。此测试需要指定硬件上有效的CUDA代码生成环境和GPU设备。

SIL貌相

在主机上执行基本的SIL分析测试。

深度学习代码生成和开发计算机上的执行测试。您可以针对CUDNN或RensorRT库。

选项 描述

生成代码

测试深层学习代码生成和建设。此测试需要在指定的硬件上有效的CUDA代码生成环境。

生成代码并执行

测试设备上的深度学习代码生成,构建和执行指定的硬件。此测试需要指定硬件上有效的CUDA代码生成环境和GPU设备。

目标

指定深度学习库以生成代码。有效的选项是CUDNN.要么张力

数据类型检查

指定输入到网络的张量数据类型或图层的张量输出的精度。在32位浮点中执行推理,使用'fp32'。对于半精度,使用'fp16'。对于8位整数,使用'int8'。默认值为'fp32'

INT8.精度需要CUDA GPU,最小计算能力为6.1。FP16.精度需要CUDA GPU,最小计算能力为7.0。

环境检查

指定库的位置,用于检查主机上的CUDA开发环境。生成matlab脚本gpuenvsettings.m.这会设置GPU编码器所需的环境变量。有关更多信息,请参阅设置先决条件产品s manbetx 845

选项 描述

CUDA安装路径

CUDA Toolkit安装的路径。

例如:

/usr/local/cuda-10.1/bin.

CUDNN.

CUDNN库安装的根文件夹的路径。

例如:

/ usr / local / cudnn /

张力

tensorrt™库安装的根夹的路径。

例如:

/ usr / local / tensorr /

NVTX库路径

往来的道路nvtx.分析所需的图书馆。要启用此项目,请选择SIL貌相

在标准的CUDA工具包安装上,此路径通常是CUDA库文件夹。

例如:

/usr/local/cuda-10.1/lib64

GPU代码生成环境检查报告

当你选择运行检查,这gpucodersetup.应用程序根据所选的设置执行环境,代码生成和其他检查。然后它生成gpucodersetupreport.报告指示测试是否已通过并提供已失败的测试的其他信息。在当前文件夹中创建相同名称报告的HTML版本。

样本环境检查报告

也可以看看

应用

职能

对象

相关话题