GPU编码器™支持为系万博1manbetx列和有向无环图(DAG)卷积神经网络(CNNs或ConvNets)生成代码。您可以为任何经过训练的卷积神经网络生成代码,它的层支持代码生成。万博1manbetx看到万博1manbetx支持层。您可以使用Deep Learning Toolbox™在CPU、GPU或多个GPU上训练卷积神经网络,也可以使用表中列出的预训练网络之一生成CUDA®代码。
网络名称 | 描述 | cuDNN | TensorRT | 手臂®马里GPU的计算库 |
---|---|---|---|---|
AlexNet |
AlexNet卷积神经网络。关于预先训练的AlexNet模型,见 的语法 |
是的 |
是的 |
是的 |
咖啡网络 |
Caffe的卷积神经网络模型。从Caffe导入掠夺网络,请参阅 |
是的 |
是的 |
是的 |
Darknet-19 |
Darknet-19卷积神经网络。有关更多信息,请参见 的语法 |
是的 |
是的 |
是的 |
Darknet-53 |
Darknet-53卷积神经网络。有关更多信息,请参见 的语法 |
是的 |
是的 |
是的 |
DeepLab v3 + |
DeepLab v3+卷积神经网络。有关更多信息,请参见 |
是的 |
是的 |
没有 |
densenet - 201 |
DenseNet-201卷积神经网络。预训练的DenseNet-201模型见 的语法 |
是的 |
是的 |
是的 |
高效 - B0 |
EfficientNet-b0卷积神经网络。预训练的EfficientNet-b0模型见 的语法 |
是的 | 是的 | 是的 |
GoogLeNet |
谷歌网卷积神经网络。有关预训练的googleet模型,请参阅 的语法 |
是的 |
是的 |
是的 |
Inception-ResNet-v2 |
Inception-ResNet-v2卷积神经网络。有关预训练的Inception-ResNet-v2模型,请参见 |
是的 |
是的 |
没有 |
Inception-v3 |
Inception-v3卷积神经网络。对于预先训练的Inception-v3模型,请参见 的语法 |
是的 |
是的 |
是的 |
Mobilenet-v2 |
MobileNet-v2卷积神经网络。有关预先训练的MobileNet-v2模型,请参见 的语法 |
是的 |
是的 |
是的 |
NASNet-Large |
大型卷积神经网络。有关预先训练的NASNet-Large模型,请参阅 |
是的 |
是的 |
没有 |
NASNET-MOBILE. |
移动卷积神经网络。有关预先训练的NASNet-Mobile模型,请参阅 |
是的 |
是的 |
没有 |
ResNet |
ResNet-18, ResNet-50和ResNet-101卷积神经网络。有关预训练的ResNet模型,请参阅 的语法 |
是的 |
是的 |
是的 |
SegNet |
多类像素分割网络。有关更多信息,请参见 |
是的 |
是的 |
没有 |
SqueezeNet |
小深度神经网络。关于预训练的挤压模型,请参阅 的语法 |
是的 |
是的 |
是的 |
VGG-16 |
VGG-16卷积神经网络。预训练的VGG-16模型见 的语法 |
是的 |
是的 |
是的 |
VGG-19 |
VGG-19卷积神经网络。预训练的vg -19模型见 的语法 |
是的 |
是的 |
是的 |
Xception |
七卷大神经网络。对于预训练Xcepion模型,请参阅 的语法 |
是的 |
是的 |
是的 |
YOLO v2. |
你只看一次版本2基于卷积神经网络的对象检测器。有关更多信息,请参见 |
是的 |
是的 |
是的 |
GPU编码器的代码生成支持以下层,用于表中指定的目万博1manbetx标深度学习库。
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
图像输入层将二维图像输入到网络并应用数据归一化。 代码生成不支持万博1manbetx |
是的 |
是的 |
是的 |
|
序列输入层将序列数据输入到网络。 cuDNN库支持向量和二维图像序列。万博1manbetxTensorRT库只支持向量输入序列。万博1manbetx 对于向量序列输入,在代码生成过程中,特征的数量必须是一个常量。 对于图像序列输入,高度、宽度和通道数量在代码生成过程中必须是一个常量。 代码生成不支持万博1manbetx |
是的 |
是的 |
没有 |
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
二维卷积层对输入应用滑动卷积滤波器。 |
是的 |
是的 |
是的 |
|
完全连接的层将输入乘以权重矩阵,然后添加偏置向量。 |
是的 |
是的 |
没有 |
|
2-D分组的卷积层将输入通道分成组并应用滑动卷积滤波器。使用分组的卷积层,用于通道 - 明智的可分离(也称为深度明智的可分离)卷积。 2-D分组的卷积层不支持ARM Mali GPU的代码生成万博1manbetx |
是的 |
是的 |
是的 |
|
一个转置的二维卷积层对特征地图进行采样。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
双向LSTM (BiLSTM)层学习时间序列或序列数据的时间步长之间的双向依赖关系。当您希望网络在每个时间步都从完整的时间序列中学习时,这些依赖关系可能非常有用。 用于代码生成, 用于代码生成, |
是的 |
是的 |
没有 |
|
平坦层将输入的空间维度折叠为通道维度。 |
是的 |
没有 |
没有 |
|
GRU层学习时间序列和序列数据中时间步长之间的依赖关系。 代码生成只支持万博1manbetx |
是的 |
是的 |
没有 |
|
LSTM层学习时间序列和序列数据中时间步长的依赖关系。 用于代码生成, 用于代码生成, |
是的 |
是的 |
没有 |
|
序列折叠层将一批图像序列转换为一批图像。使用序列折叠层对图像序列的时间步分别进行卷积运算。 |
是的 |
没有 |
没有 |
|
序列输入层将序列数据输入到网络。 cuDNN库支持向量和二维图像序列。万博1manbetxTensorRT库只支持向量输入序列。万博1manbetx 对于向量序列输入,在代码生成过程中,特征的数量必须是一个常量。 对于图像序列输入,高度、宽度和通道数量在代码生成过程中必须是一个常量。 代码生成不支持万博1manbetx |
是的 |
是的 |
没有 |
|
序列展开层在序列折叠后恢复输入数据的序列结构。 |
是的 |
没有 |
没有 |
|
词嵌入层将词索引映射到向量。 |
是的 |
是的 |
没有 |
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
剪切的ReLU层执行一个阈值操作,其中小于0的输入值被设置为0,大于0的输入值被设置为0剪裁天花板都被设定为上限。 |
是的 |
是的 |
是的 |
|
ELU激活层在正输入上执行恒等运算,在负输入上执行指数非线性。 |
是的 |
是的 |
没有 |
|
泄漏的ReLU层执行阈值操作,其中任何小于零的输入值乘以一个固定的标量。 |
是的 |
是的 |
是的 |
|
ReLU层对输入的每个元素执行一个阈值操作,其中任何小于0的值都被设置为0。 |
是的 |
是的 |
是的 |
|
一个 |
是的 |
是的 |
没有 |
|
双曲正切(tanh)激活层对层输入应用tanh函数。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
批规范化层对跨小批的每个输入通道进行规范化。 |
是的 |
是的 |
是的 |
|
2-D裁剪层将2-D裁剪应用于输入。 |
是的 |
是的 |
是的 |
|
信道方面的局部响应(跨信道)规范化层执行信道方面的规范化。 |
是的 |
是的 |
是的 |
|
dropout层以给定的概率将输入元素随机设置为零。 |
是的 |
是的 |
是的 |
|
演员或批评网络的缩放层。 的值,用于代码生成 |
是的 |
是的 |
是的 |
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
平均池化层通过将输入分割成矩形池化区域并计算每个区域的平均值来执行下采样。 |
是的 |
是的 |
是的 |
|
一个全局平均池化层通过计算输入的高度和宽度尺寸的平均值来执行下采样。 |
是的 |
是的 |
是的 |
|
一个全局最大池化层通过计算输入的最大高度和宽度尺寸来执行下采样。 |
是的 |
是的 |
是的 |
|
最大池化层通过将输入分割成矩形池化区域,并计算每个区域的最大值来进行下采样。 |
是的 |
是的 |
是的 |
|
最大的取消池层取消最大池层的输出池。 |
是的 |
是的 |
没有 |
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
添加层以元素方式添加来自多个神经网络层的输入。 |
是的 |
是的 |
是的 |
|
连接层接受输入,并沿着指定的维度连接输入。 |
是的 |
是的 |
没有 |
|
深度连接层接受具有相同高度和宽度的输入,并沿着第三维(通道维)将它们连接起来。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
锚盒层存储用于目标检测网络中的特征图的锚盒。 |
是的 |
是的 |
是的 |
|
焦点损耗层使用焦点损耗预测对象类。 | 是的 |
是的 |
是的 |
|
空间到深度层将输入的空间块排列到深度维度中。当你需要组合不同大小的特征图而不丢弃任何特征数据时,使用这一层。 | 是的 |
是的 |
是的 |
|
SSD合并层将特征映射的输出进行合并,用于后续的回归和分类损失计算。 |
是的 |
是的 |
没有 |
|
盒回归层使用平滑的L1损失函数来细化盒的边界位置。使用这一层来创建一个更快的R-CNN对象检测网络。 | 是的 |
是的 |
是的 |
|
区域建议网络(RPN)分类层将图像区域划分为这两种类型对象或背景利用交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 | 是的 |
是的 |
是的 |
|
为YOLO v2对象检测网络创建输出层。 |
是的 |
是的 |
是的 |
|
为YOLO v2对象检测网络创建重组层。 |
是的 |
是的 |
是的 |
|
创建YOLO v2对象检测网络的转换层。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
分类层用于计算具有互斥类的多类分类问题的交叉熵损失。 |
是的 |
是的 |
是的 |
|
骰子像素分类层使用广义骰子损耗为每个图像像素或体素提供分类标签。 |
是的 |
是的 |
是的 |
|
焦点损耗层使用焦点损耗预测对象类。 | 是的 |
是的 |
是的 |
|
所有输出层,包括使用创建的自定义分类或回归输出层 有关用于定义自定义分类输出层并指定丢失功能的示例,请参阅定义自定义分类输出层(深度学习工具箱)。 有关展示如何定义自定义回归输出层并指定丢失功能的示例,请参阅定义自定义回归输出层(深度学习工具箱)。 |
是的 |
是的 |
是的 |
|
像素分类层为每个图像像素或体素提供分类标签。 |
是的 |
是的 |
是的 |
|
盒回归层使用平滑的L1损失函数来细化盒的边界位置。使用这一层来创建一个更快的R-CNN对象检测网络。 | 是的 |
是的 |
是的 |
|
回归层计算回归问题的半平均误差损失。 |
是的 |
是的 |
是的 |
|
区域建议网络(RPN)分类层将图像区域划分为这两种类型对象或背景利用交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 | 是的 |
是的 |
是的 |
|
一个sigmoid层应用一个sigmoid函数到输入。 |
是的 |
是的 |
是的 |
|
softmax层对输入应用softmax功能。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
按c风格(主要行)顺序将激活简化为1-D。 |
是的 |
是的 |
是的 |
|
空间数据的全球平均汇集层。 |
是的 |
是的 |
是的 |
|
乙状结肠活化层。 |
是的 |
是的 |
是的 |
|
双曲正切激活层。 |
是的 |
是的 |
是的 |
|
零填充层为二维输入。 |
是的 |
是的 |
是的 |
|
一层,执行按元素顺序缩放输入,然后添加。 |
是的 |
是的 |
是的 |
|
使输入张量的空间维数平坦于通道维数。 |
是的 |
是的 |
是的 |
|
实现ONNX标识操作符的层。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
|
自定义图层,有或没有学习参数,您为您的问题定义。 要了解如何定义自定义深度学习层,请参见定义自定义深度学习层(深度学习工具箱)和为代码生成定义自定义深度学习层(深度学习工具箱)。 有关如何为具有自定义层的网络生成代码的示例,请参见使用YOLO v3深度学习进行目标检测的代码生成。 自定义层的输出必须是固定大小的数组。 使用 cuDNN目标支持自定义层的万博1manbetx行主代码和列主代码生成。TensorRT目标只支持以列为主万博1manbetx的代码生成。 不支持包含自定义层和LSTM或GRU层的序列网络的代码生成。万博1manbetx Simulink不支持带有自定义层的深度学习网络的代码生成万博1manbetx万博1manbetx®。 |
是的 |
是的 |
没有 |
GPU编码器的代码生成支持以下类,用于表中指定的目标万博1manbetx深度学习库。
的名字 | 描述 | cuDNN | TensorRT | Mali GPU的ARM计算库 |
---|---|---|---|---|
DAGNetwork (深度学习工具箱) |
用于深度学习的有向无环图(DAG)网络
|
是的 |
是的 |
是的 |
SeriesNetwork (深度学习工具箱) |
深度学习系列网络
|
是的 |
是的 |
是的 |
ssdObjectDetector (计算机视觉工具箱) |
Object通过ssd检测器检测对象。
|
是的 |
是的 |
没有 |
yolov2ObjectDetector (计算机视觉工具箱) |
使用YOLO v2对象检测器检测对象
|
是的 |
是的 |
是的 |
coder.CodeConfig
|Coder.CudnnConfig
|coder.EmbeddedCodeConfig
|coder.gpuConfig
|coder.gpuEnvConfig
|coder.TensorRTConfig