GPU编码器™支持序列万博1manbetx和有向无环图(DAG)卷积神经网络(CNNs或ConvNets)的代码生成。您可以为任何训练有素的卷积神经网络生成代码,这些神经网络的层支持代码生成。万博1manbetx看到万博1manbetx支持层.您可以使用深度学习工具箱™在CPU、GPU或多个GPU上训练卷积神经网络,或使用表中列出的预训练网络之一并生成CUDA®密码
网络名称 | 描述 | cuDNN | 坦索特 | 臂®马里GPU的计算图书馆 |
---|---|---|---|---|
阿列克斯内特 |
AlexNet卷积神经网络。有关预训练的AlexNet模型,请参见 的语法 |
对 |
对 |
对 |
Caffe网络 |
Caffe的卷积神经网络模型。要从Caffe导入预先训练过的网络,请参见 |
对 |
对 |
对 |
黑暗-19 |
Darknet-19卷积神经网络。有关更多信息,请参见 的语法 |
对 |
对 |
对 |
黑暗-53 |
Darknet-53卷积神经网络。有关更多信息,请参阅 的语法 |
对 |
对 |
对 |
DeepLab v3 + |
DeepLab v3+卷积神经网络。有关更多信息,请参见 |
对 |
对 |
没有 |
densenet - 201 |
DenseNet-201卷积神经网络。关于预先训练的DenseNet-201模型,请看 的语法 |
对 |
对 |
对 |
EfficientNet-b0 |
efficient -b0卷积神经网络。关于预先训练过的EfficientNet-b0模型,请参见 的语法 |
对 | 对 | 对 |
水壶 |
GoogLeNet卷积神经网络。有关预训练的GoogLeNet模型,请参见 的语法 |
对 |
对 |
对 |
Inception-ResNet-v2 |
Inception-ResNet-v2卷积神经网络。关于预训练的Inception-ResNet-v2模型,请参见 |
对 |
对 |
没有 |
Inception-v3 |
Inception-v3卷积神经网络。关于预训练的Inception-v3模型,请参见 的语法 |
对 |
对 |
对 |
Mobilenet-v2 |
v2卷积神经网络。关于预先训练过的MobileNet-v2模型,请参见 的语法 |
对 |
对 |
对 |
NASNet-Large |
大型卷积神经网络。关于预先训练的NASNet-Large模型,请参见 |
对 |
对 |
没有 |
NASNet-Mobile |
NASNet移动卷积神经网络。有关预训练的NASNet移动模型,请参见 |
对 |
对 |
没有 |
ResNet |
ResNet-18, ResNet-50和ResNet-101卷积神经网络。关于预先训练的ResNet模型,请参见 的语法 |
对 |
对 |
对 |
赛格网 |
多类像素分割网络。有关更多信息,请参见 |
对 |
对 |
没有 |
挤压网 |
小型深度神经网络。对于预先训练过的SqueezeNet模型,请看 的语法 |
对 |
对 |
对 |
VGG-16 |
VGG-16卷积神经网络。对于预先训练的VGG-16模型,请参见 的语法 |
对 |
对 |
对 |
VGG-19 |
vgg19卷积神经网络。关于预先训练的VGG-19模型,请参见 的语法 |
对 |
对 |
对 |
Xception |
卷积神经网络除外。关于预先训练的exception模型,请参见 的语法 |
对 |
对 |
对 |
YOLO v2意思 |
你只看一次基于卷积神经网络的物体检测器。有关更多信息,请参见 |
对 |
对 |
对 |
对于表中指定的目标深度学习库,GPU Coder支万博1manbetx持以下层进行代码生成。
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
图像输入层将二维图像输入到网络并应用数据规范化。 不支持代码生成万博1manbetx |
对 |
对 |
对 |
|
序列输入层将序列数据输入到网络。 cuDNN库支持矢量和二维图像序列。万博1manbetxTensorRT库仅支持矢量输入序列。 对于矢量序列输入,在代码生成过程中,特征的数量必须是常数。 对于图像序列输入,在代码生成期间,通道的高度、宽度和数量必须是一个常量。 不支持代码生成万博1manbetx |
对 |
对 |
没有 |
|
特征输入层将特征数据输入到网络,并进行数据规范化。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
二维卷积层将滑动卷积滤波器应用于输入。 |
对 |
对 |
对 |
|
一个完全连通的层将输入乘以一个权值矩阵,然后添加一个偏置向量。 |
对 |
对 |
没有 |
|
一个二维分组卷积层将输入通道分成组,并应用滑动卷积滤波器。使用分组卷积层进行信道可分(也称为深度可分)卷积。 ARM Mali GPU的代码生成不支持2-D分组卷积层万博1manbetx |
对 |
对 |
对 |
|
转置的二维卷积层对特征地图进行上采样。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
双向LSTM (BiLSTM)层学习时间序列或序列数据的时间步长之间的双向长期依赖关系。当您希望网络在每个时间步骤中从完整的时间序列中学习时,这些依赖项可能会很有用。 对于代码生成, 对于代码生成, |
对 |
对 |
没有 |
|
扁平层将输入的空间维度折叠为通道维度。 |
对 |
没有 |
没有 |
|
GRU层学习时间序列和序列数据中时间步之间的依赖关系。 代码生成只支持万博1manbetx |
对 |
对 |
没有 |
|
LSTM层学习时间序列和序列数据中时间步长之间的长期依赖关系。 对于代码生成, 对于代码生成, |
对 |
对 |
没有 |
|
序列折叠层将一批图像序列转换为一批图像。使用序列折叠层对图像序列的时间步独立进行卷积运算。 |
对 |
没有 |
没有 |
|
序列输入层将序列数据输入到网络。 cuDNN库支持矢量和二维图像序列。万博1manbetxTensorRT库仅支持矢量输入序列。 对于矢量序列输入,在代码生成过程中,特征的数量必须是常数。 对于图像序列输入,在代码生成期间,通道的高度、宽度和数量必须是一个常量。 不支持代码生成万博1manbetx |
对 |
对 |
没有 |
|
序列展开层还原输入数据在序列折叠后的序列结构。 |
对 |
没有 |
没有 |
|
单词嵌入层将单词索引映射到向量。 |
对 |
对 |
没有 |
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
被裁剪的ReLU层执行一个阈值操作,其中任何小于0的输入值都被设置为0,任何高于剪裁天花板被设置在了天花板上。 |
对 |
对 |
对 |
|
ELU激活层对正输入执行恒等式运算,对负输入执行指数非线性运算。 |
对 |
对 |
没有 |
|
一个泄漏的ReLU层执行一个阈值操作,其中任何小于零的输入值乘以一个固定标量。 |
对 |
对 |
对 |
|
ReLU层对输入的每个元素执行一个阈值操作,其中任何小于零的值都被设置为零。 |
对 |
对 |
对 |
|
一个 |
对 |
对 |
没有 |
|
swish激活层对层输入应用swish功能。 |
对 |
对 |
没有 |
|
双曲正切(tanh)激活层将tanh函数应用于层输入。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
批处理规范化层通过一个小批处理规范化每个输入通道。 |
对 |
对 |
对 |
|
2-D作物层应用2-D裁剪输入。 |
对 |
对 |
对 |
|
信道本地响应(跨信道)归一化层执行信道归一化。 |
对 |
对 |
对 |
|
退出层以给定的概率将输入元素随机设置为零。 |
对 |
对 |
对 |
|
组规范化层独立地规范化每个观察的通道分组子集上的一小批数据。 |
对 |
对 |
没有 |
|
演员或评论家网络的缩放层。 的值用于代码生成 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
平均池化层通过将输入划分为矩形池化区域并计算每个区域的平均值来执行向下采样。 |
对 |
对 |
对 |
|
全局平均池层通过计算输入的高度和宽度维度的平均值来执行下采样。 |
对 |
对 |
对 |
|
全局最大池化层通过计算输入的最大高度和宽度维度来执行向下采样。 |
对 |
对 |
对 |
|
最大池化层通过将输入划分为矩形池化区域,并计算每个区域的最大值来进行向下采样。 |
对 |
对 |
对 |
|
最大非池化层取消池化最大池化层的输出。 |
对 |
对 |
没有 |
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
加法层以元素的方式增加来自多个神经网络层的输入。 |
对 |
对 |
对 |
|
连接层接收输入并将它们沿着指定的维度连接起来。 |
对 |
对 |
没有 |
|
深度级联层接受具有相同高度和宽度的输入,并沿第三维(通道维)将它们级联。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
锚定框层存储用于对象检测网络的特征地图的锚定框。 |
对 |
对 |
对 |
|
二维深度到空间层将深度维度的数据置换成二维空间数据块。 | 对 |
对 |
对 |
|
焦点丢失层使用焦点丢失预测对象类。 | 对 |
对 |
对 |
|
空间到深度层将输入的空间块置换为深度维度。当您需要在不丢弃任何特征数据的情况下组合不同大小的特征图时,可以使用此层。 | 对 |
对 |
对 |
|
SSD合并层合并特征图的输出,用于后续回归和分类损失计算。 |
对 |
对 |
没有 |
|
盒回归层通过使用平滑的L1损失函数来改进包围盒的位置。使用这一层创建一个快速或更快的R-CNN对象检测网络。 | 对 |
对 |
对 |
|
区域建议网络(RPN)分类层将图像区域分类为对象或背景通过交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 | 对 |
对 |
对 |
|
为YOLO v2对象检测网络创建输出层。 |
对 |
对 |
对 |
|
为YOLO v2对象检测网络创建重组层。 |
对 |
对 |
对 |
|
为YOLO v2对象检测网络创建变换层。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
分类层计算具有互斥类的多类分类问题的交叉熵损失。 |
对 |
对 |
对 |
|
骰子像素分类层使用广义骰子丢失为每个图像像素或体素提供分类标签。 |
对 |
对 |
对 |
|
焦点丢失层使用焦点丢失预测对象类。 | 对 |
对 |
对 |
|
使用创建的所有输出层,包括自定义分类或回归输出层 有关如何定义自定义分类输出层和指定损失函数的示例,请参见定义自定义分类输出层(深度学习工具箱). 有关如何定义自定义回归输出层和指定损失函数的示例,请参见定义自定义回归输出层(深度学习工具箱). |
对 |
对 |
对 |
|
像素分类层为每个图像像素或体素提供分类标签。 |
对 |
对 |
对 |
|
盒回归层通过使用平滑的L1损失函数来改进包围盒的位置。使用这一层创建一个快速或更快的R-CNN对象检测网络。 | 对 |
对 |
对 |
|
回归层计算回归问题的半均方误差损失。 |
对 |
对 |
对 |
|
区域建议网络(RPN)分类层将图像区域分类为对象或背景通过交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 | 对 |
对 |
对 |
|
s型层将s型函数应用于输入。 |
对 |
对 |
对 |
|
softmax层对输入端应用softmax功能。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
假设c风格(行为主)顺序,将激活压成一维。 |
对 |
对 |
对 |
|
空间数据的全球平均池化层。 |
对 |
对 |
对 |
|
乙状激活层。 |
对 |
对 |
对 |
|
双曲正切活化层。 |
对 |
对 |
对 |
|
用于二维输入的零填充层。 |
对 |
对 |
对 |
|
层,对输入执行按元素缩放,然后添加。 |
对 |
对 |
对 |
|
将输入张量的空间维度展平为通道维度。 |
对 |
对 |
对 |
|
实现ONNX标识操作符的层。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
|
自定义层,有或没有可学习的参数,您为您的问题定义。 要了解如何定义自定义深度学习层,请参见定义自定义深度学习层(深度学习工具箱)和定义用于代码生成的自定义深度学习层(深度学习工具箱). 有关如何为具有自定义图层的网络生成代码的示例,请参见基于YOLO v3深度学习的目标检测代码生成. 自定义图层的输出必须是固定大小的数组。 使用 cuDNN目标支持为自定义层万博1manbetx生成行主代码和列主代码。TensorRT目标仅支持列主代码生成。 对于代码生成,自定义层必须包含 不支持包含自定义层和LSTM或GRU层的序列网络的代码生成。万博1manbetx 你可以通过
对于不支持的万博1manbetx 函数Z=预测(层,X)如果coder.target (MATLAB的Z = doprecdict (X);其他的如果isdlarray(X) X1 = extractdata(X);Z1 = doPredict (X1);Z = dlarray (Z1);其他的Z = doPredict (X);结束结束结束 |
对 |
对 |
没有 |
对于表中指定的目标深度学习库,GPU Coder支持万博1manbetx以下类生成代码。
名称 | 描述 | cuDNN | 坦索特 | 用于马里GPU的ARM计算库 |
---|---|---|---|---|
达格网络 (深度学习工具箱) |
用于深度学习的有向无环图(DAG)网络
|
对 |
对 |
对 |
dlnetwork (深度学习工具箱) |
深度学习网络自定义训练循环
|
对 |
对 |
没有 |
SeriesNetwork (深度学习工具箱) |
深度学习系列网络
|
对 |
对 |
对 |
ssdObjectDetector (计算机视觉工具箱) |
对象使用基于ssd的检测器检测对象。
|
对 |
对 |
没有 |
yolov2ObjectDetector (计算机视觉工具箱) |
使用YOLO v2对象检测器检测对象
|
对 |
对 |
对 |
coder.gpuConfig
|编码器。CodeConfig
|coder.EmbeddedCodeConfig
|coder.gpuEnvConfig
|编码器。CuDNNConfig
|编码器。TensorRTConfig