imageInputLayer

图像输入层

展开全部页面

描述

图像输入层将2-D图像输入到网络并应用数据规范化。

对于3d图像输入，使用image3dInputLayer．

创建

语法

图层= imageInputLayer(inputSize)

imageInputLayer(inputSize,Name,Value)

描述

层= imageInputLayer (inputSize）返回图像输入层，并指定InputSize财产。

例子

层= imageInputLayer (inputSize，名称,值）设置可选的归一化，NormalizationDimension，的意思是，StandardDeviation，最小值，马克斯，SplitComplexInputs,的名字使用一个或多个名称-值参数的属性。属性名用引号括起来。

属性

全部展开

图像输入

`InputSize`- - - - - -输入的大小
整数行向量

此属性是只读的。

输入数据的大小，指定为整数行向量[h w c],在那里h，w,c分别对应通道的高度、宽度和数量。

对于灰度图像，指定与的向量c等于1．
对于RGB图像，指定一个向量c等于3.．
对于多光谱或高光谱图像，指定一个向量c等于通道数。

3-D图像或体积输入，使用image3dInputLayer．

例子:[224 224 3]

`归一化`- - - - - -数据归一化
`“zerocenter”`(默认)|`“zscore”`|`“rescale-symmetric”`|`“rescale-zero-one”`|`“没有”`|函数处理

此属性是只读的。

每次数据通过输入层向前传播时应用数据规范化，指定为以下之一:

“zerocenter”-减去指定的平均值的意思是．
“zscore”-减去指定的平均值的意思是然后除以StandardDeviation．
“rescale-symmetric”-使用指定的最小值和最大值将输入重新缩放到范围[- 1,1]最小值而且马克斯,分别。
“rescale-zero-one”-使用指定的最小值和最大值将输入重新缩放到范围[0,1]最小值而且马克斯,分别。
“没有”—不要对输入数据进行归一化。
function句柄-使用指定的函数规范化数据。函数必须符合这个形式Y = func(X),在那里X输入数据和输出数据吗Y是规范化的数据。

提示

方法时，该软件默认自动计算归一化统计信息trainNetwork函数。为节省训练时的时间，请指定规范化所需的统计信息并设置ResetInputNormalization选项trainingOptions来0（的意见）.

`NormalizationDimension`- - - - - -规范化维度
`“汽车”`(默认)|`“通道”`|`“元素”`|`“所有”`

归一化维度，指定为以下之一:

“汽车”—如果培训选项为假您可以指定任何规范化统计信息(的意思是，StandardDeviation，最小值,或马克斯)，然后在与统计数据相匹配的维度上归一化。否则，在训练时重新计算统计数据并应用通道的归一化。
“通道”-通道的标准化。
“元素”-元素的标准化。
“所有”-使用标量统计数据规范化所有值。

数据类型:字符|字符串

`的意思是`- - - - - -均值为零中心和z分数归一化
`［］`(默认)|三维数组|数字标量

0 -center和z-score归一化的平均值，指定为ah——- - - - - -w——- - - - - -c数组，一个1 × 1 × -c每个通道的均值数组、数值标量或［］,在那里h，w,c分别对应平均值的高度、宽度和通道数。

如果您指定的意思是属性,然后归一化必须“zerocenter”或“zscore”．如果的意思是是［］，则trainNetwork函数计算平均值。训练一个dlnetwork对象使用自定义训练循环或组装网络而不使用assembleNetwork函数时，必须设置的意思是属性设置为数值标量或数值数组。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64

`StandardDeviation`- - - - - -z分数归一化的标准差
`［］`(默认)|三维数组|数字标量

z分数归一化的标准差，用a表示h——- - - - - -w——- - - - - -c数组，一个1 × 1 × -c每个通道的均值数组、数值标量或［］,在那里h，w,c分别对应于标准偏差的高度、宽度和通道数。

如果您指定StandardDeviation属性,然后归一化必须“zscore”．如果StandardDeviation是［］，则trainNetwork函数计算标准偏差。训练一个dlnetwork对象使用自定义训练循环或组装网络而不使用assembleNetwork函数时，必须设置StandardDeviation属性设置为数值标量或数值数组。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64

`最小值`- - - - - -重新缩放的最小值
`［］`(默认)|三维数组|数字标量

重新缩放的最小值，指定为h——- - - - - -w——- - - - - -c数组，一个1 × 1 × -c每个通道的最小值数组、数字标量或［］,在那里h，w,c分别对应最小值的高度、宽度和通道数。

如果您指定最小值属性,然后归一化必须“rescale-symmetric”或“rescale-zero-one”．如果最小值是［］，则trainNetwork函数计算最小值。训练一个dlnetwork对象使用自定义训练循环或组装网络而不使用assembleNetwork函数时，必须设置最小值属性设置为数值标量或数值数组。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64

`马克斯`- - - - - -缩放的最大值
`［］`(默认)|三维数组|数字标量

重新缩放的最大值，指定为h——- - - - - -w——- - - - - -c数组，一个1 × 1 × -c每个通道的最大值数组、数值标量或［］,在那里h，w,c分别对应最大值的高度、宽度和通道数。

如果您指定马克斯属性,然后归一化必须“rescale-symmetric”或“rescale-zero-one”．如果马克斯是［］，则trainNetwork函数计算最大值。训练一个dlnetwork对象使用自定义训练循环或组装网络而不使用assembleNetwork函数时，必须设置马克斯属性设置为数值标量或数值数组。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64

`SplitComplexInputs`- - - - - -标志，将输入数据分割为实组件和虚组件
`0`（`假`）(默认)|`1`（`真正的`）

此属性是只读的。

标志，将输入数据分割为实组件和虚组件，指定为以下值之一:

0（假) -不要分割输入数据。
1（真正的) -将数据分割为实分量和虚分量。

当SplitComplexInputs是1，则该层输出的通道数是输入数据的两倍。例如，如果输入数据是复值numChannels通道，然后该层输出数据2 * numChannels通道，通道1通过numChannels包含输入数据和的真实组件numChannels + 1通过2 * numChannels包含输入数据的虚构组件。如果输入数据是实数，则通道numChannels + 1通过2 * numChannels都是零。

在网络中输入复值数据SplitComplexInputs输入层的选项必须为1．

有关显示如何使用复值数据训练网络的示例，请参见复值数据训练网络．

`DataAugmentation`- - - - - -数据增强变换
`“没有”`(默认)|`“randcrop”`|`“randfliplr”`|单元格阵列`“randcrop”`而且`“randfliplr”`

此属性是只读的。

请注意

的DataAugmentation不推荐使用。要使用裁剪、反射和其他几何变换对图像进行预处理，请使用augmentedImageDatastore代替。

数据增强转换为在训练期间使用，指定为以下之一。

“没有”—不进行数据扩充
“randcrop”-从训练图像中随机裁剪。随机裁剪的大小与输入大小相同。
“randfliplr”-随机翻转输入图像水平与50%的机会。
单元格阵列“randcrop”而且“randfliplr”．软件按单元格数组中指定的顺序应用增强。

增强图像数据是减少过拟合的另一种方法[1]，[２]．

数据类型:字符串|字符|细胞

层

`的名字`- - - - - -层的名字
`”`(默认)|特征向量|字符串标量

层名，指定为字符向量或字符串标量。为层数组输入时，trainNetwork，assembleNetwork，layerGraph,dlnetwork函数自动为具有该名称的层分配名称”．

数据类型:字符|字符串

`NumInputs`- - - - - -输入数量
0(默认)

此属性是只读的。

该层的输入数量。该层没有输入。

数据类型:双

`InputNames`- - - - - -输入名字
`{}`(默认)

此属性是只读的。

输入层的名称。该层没有输入。

数据类型:细胞

`NumOutputs`- - - - - -输出数
`1`(默认)

此属性是只读的。

层的输出数量。这个图层只有一个输出。

数据类型:双

`OutputNames`- - - - - -输出的名字
`{“出”}`(默认)

此属性是只读的。

输出层的名称。这个图层只有一个输出。

数据类型:细胞

例子

全部折叠

创建图像输入层

打开实时脚本

创建一个带有名称的28 * 28彩色图像的图像输入层“输入”．默认情况下，该层通过从每个输入图像中减去训练集的平均图像来执行数据归一化。

inputlayer = imageInputLayer([28 28 3]，“名字”，“输入”）

inputlayer = ImageInputLayer with properties: Name: 'input' InputSize: [28 28 3] SplitComplexInputs: 0超参数DataAugmentation: 'none'归一化:'zerocenter' NormalizationDimension: 'auto'意思:[]

类中包含图像输入层层数组中。

层= [.．.imageInputLayer([28 28 1]) convolution2dLayer(5,20) reluLayer maxPooling2dLayer(2，“步”，2) fullyConnectedLayer(10) softmaxLayer classificationLayer]

2 "二维卷积20 5x5卷积与stride[1 1]和填充[0 0 0 0 0]3 " ReLU ReLU 4 "二维最大池化2x2最大池化与stride[2 2]和填充[0 0 0 0 0]5 "全连接10全连接层6 " Softmax Softmax 7 "分类输出crossentropyex

参考文献

[1]克里日夫斯基，A. I.萨茨科弗，G. E.辛顿。“深度卷积神经网络的ImageNet分类”。神经信息处理系统研究进展．2012年第25卷。

[2]希瑞安，D.， U.迈耶，J.施米德休伯。用于图像分类的多列深度神经网络。IEEE计算机视觉与模式识别会议, 2012年。

扩展功能

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制:

不支持代码生成万博1manbetx“归一化”使用函数句柄指定。
代码生成不支持复杂输入，也不支持万博1manbetx“SplitComplexInputs”选择。

GPU代码生成
使用GPU Coder™为NVIDIA®GPU生成CUDA®代码。

使用注意事项和限制:

不支持代码生成万博1manbetx“归一化”使用函数句柄指定。
代码生成不支持复杂输入，也不支持万博1manbetx“SplitComplexInputs”选择。

版本历史

在R2016a中引入

全部展开

R2019b:`AverageImage`属性将被移除

AverageImage将被删除。使用的意思是代替。的所有实例要更新代码，请替换AverageImage与的意思是．需要对代码进行额外更新的属性之间没有差异。

R2019b:`imageInputLayer`而且`image3dInputLayer`默认情况下，使用通道规范化

从R2019b开始，imageInputLayer而且image3dInputLayer默认情况下，使用通道规范化。在以前的版本中，这些层使用元素规范化。要重现此行为，请设置NormalizationDimension选择这些图层“元素”．

另请参阅

imageInputLayer

描述

创建

语法

描述

属性

图像输入

InputSize- - - - - -输入的大小整数行向量

归一化- - - - - -数据归一化“zerocenter”(默认)|“zscore”|“rescale-symmetric”|“rescale-zero-one”|“没有”|函数处理

NormalizationDimension- - - - - -规范化维度“汽车”(默认)|“通道”|“元素”|“所有”

的意思是- - - - - -均值为零中心和z分数归一化［］(默认)|三维数组|数字标量

StandardDeviation- - - - - -z分数归一化的标准差［］(默认)|三维数组|数字标量

最小值- - - - - -重新缩放的最小值［］(默认)|三维数组|数字标量

马克斯- - - - - -缩放的最大值［］(默认)|三维数组|数字标量

SplitComplexInputs- - - - - -标志，将输入数据分割为实组件和虚组件0（假）(默认)|1（真正的）

DataAugmentation- - - - - -数据增强变换“没有”(默认)|“randcrop”|“randfliplr”|单元格阵列“randcrop”而且“randfliplr”

层

的名字- - - - - -层的名字”(默认)|特征向量|字符串标量

NumInputs- - - - - -输入数量0(默认)

InputNames- - - - - -输入名字{}(默认)

NumOutputs- - - - - -输出数1(默认)

OutputNames- - - - - -输出的名字{“出”}(默认)

例子

创建图像输入层

参考文献

扩展功能

C/ c++代码生成使用MATLAB®Coder™生成C和c++代码。

GPU代码生成使用GPU Coder™为NVIDIA®GPU生成CUDA®代码。

版本历史

R2019b:AverageImage属性将被移除

R2019b:imageInputLayer而且image3dInputLayer默认情况下，使用通道规范化

另请参阅

主题

`InputSize`- - - - - -输入的大小
整数行向量

`归一化`- - - - - -数据归一化
`“zerocenter”`(默认)|`“zscore”`|`“rescale-symmetric”`|`“rescale-zero-one”`|`“没有”`|函数处理

`NormalizationDimension`- - - - - -规范化维度
`“汽车”`(默认)|`“通道”`|`“元素”`|`“所有”`

`的意思是`- - - - - -均值为零中心和z分数归一化
`［］`(默认)|三维数组|数字标量

`StandardDeviation`- - - - - -z分数归一化的标准差
`［］`(默认)|三维数组|数字标量

`最小值`- - - - - -重新缩放的最小值
`［］`(默认)|三维数组|数字标量

`马克斯`- - - - - -缩放的最大值
`［］`(默认)|三维数组|数字标量

`SplitComplexInputs`- - - - - -标志，将输入数据分割为实组件和虚组件
`0`（`假`）(默认)|`1`（`真正的`）

`DataAugmentation`- - - - - -数据增强变换
`“没有”`(默认)|`“randcrop”`|`“randfliplr”`|单元格阵列`“randcrop”`而且`“randfliplr”`

`的名字`- - - - - -层的名字
`”`(默认)|特征向量|字符串标量

`NumInputs`- - - - - -输入数量
0(默认)

`InputNames`- - - - - -输入名字
`{}`(默认)

`NumOutputs`- - - - - -输出数
`1`(默认)

`OutputNames`- - - - - -输出的名字
`{“出”}`(默认)

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

GPU代码生成
使用GPU Coder™为NVIDIA®GPU生成CUDA®代码。

R2019b:`AverageImage`属性将被移除

R2019b:`imageInputLayer`而且`image3dInputLayer`默认情况下，使用通道规范化