主要内容

imageInputlayer.

图像输入层

描述

图像输入层将2-D图像输入到网络并应用数据归一化。

对于3-D图像输入,使用image3dInputLayer

创建

描述

= imageInputLayer(输入)返回一个图像输入层,并指定输入财产。

例子

= imageInputLayer(输入,名称,值)设置可选特性使用名称值对。您可以指定多个名称值对。用单引号括起每个属性名称。

特性

展开全部

图像输入

输入数据的大小,指定为整数的行向量[w c h], 在哪里h,w,c分别对应通道的高度、宽度和数量。

  • 对于灰度图像,用c等于1

  • 对于RGB图像,用c等于3.

  • 对于多光谱或高光谱图像,请指定矢量c等于频道的数量。

对于3-D图像或卷输入,使用image3dInputLayer

例子:[224 224 3]

要应用每次数据的数据归一化将通过输入图层向前传播,指定为以下之一:

  • 'Zerocenter'- 减去所指定的平均值吝啬的

  • “zscore”- 减去所指定的平均值吝啬的并除以StandardDeviation

  • “rescale-symmetric”-使用指定的最小值和最大值将输入缩放到[- 1,1]范围内马克斯,分别。

  • 'Rescale-Zero-One'- 使用最小值和最大值,重新缩放输入到范围内[0,1]马克斯,分别。

  • “没有”- 请勿将输入数据标准化。

  • 函数句柄-使用指定的函数规范化数据。函数必须具有这种形式Y = func (X), 在哪里X输入数据和输出是输出Y是标准化的数据。

提示

默认情况下,该软件可自动计算培训时间的标准化统计信息。要节省培训时,请指定规范化所需的统计信息,并设置“ResetInputNormalization”选项培训选项

标准化维度,指定为以下之一:

  • “汽车”—如果培训选项是并且您指定了任何归一化统计信息(吝啬的,StandardDeviation,, 或者马克斯),然后通过匹配统计数据的尺寸标准化。否则,重新计算培训时间并申请渠道明智的归一化。

  • '渠道'——Channel-wise正常化。

  • “元素”——Element-wise正常化。

  • “所有”—使用标量统计对所有值进行规范化。

零中心和z分数归一化的平均值,指定为ah-经过-w-经过-c数组,1-by-1-by -c数组意味着每个通道,一个数字标量,或[], 在哪里h,w,c分别对应于平均值的高度、宽度和通道数。

如果您指定吝啬的属性,然后归一化必须'Zerocenter'或者“zscore”。如果吝啬的[],然后软件计算训练时的平均值。

您可以在不经过培训创建网络时设置此属性(例如,在使用汇编)。

数据类型:单身的|双倍的|INT8.|int16|INT32.|INT64.|uint8.|uint16|UINT32.|UINT64

标准偏差为z评分标准化,指定为ah-经过-w-经过-c数组,1-by-1-by -c数组意味着每个通道,一个数字标量,或[], 在哪里h,w,c分别对应高度、宽度和通道数的标准差。

如果您指定StandardDeviation属性,然后归一化必须“zscore”。如果StandardDeviation[],软件计算训练时的标准差。

您可以在不经过培训创建网络时设置此属性(例如,在使用汇编)。

数据类型:单身的|双倍的|INT8.|int16|INT32.|INT64.|uint8.|uint16|UINT32.|UINT64

重新定义的最小值,指定为ah-经过-w-经过-c数组,1-by-1-by -c每个通道的最小值数组,数字标量或[], 在哪里h,w,c分别对应于最小值的高度、宽度和通道数。

如果您指定属性,然后归一化必须“rescale-symmetric”或者'Rescale-Zero-One'。如果[],然后软件计算出训练时间的最小值。

您可以在不经过培训创建网络时设置此属性(例如,在使用汇编)。

数据类型:单身的|双倍的|INT8.|int16|INT32.|INT64.|uint8.|uint16|UINT32.|UINT64

重新定义的最大值,指定为ah-经过-w-经过-c数组,1-by-1-by -c每个通道的最大数组,数字标量或[], 在哪里h,w,c分别对应于最大值的高度、宽度和通道数。

如果您指定马克斯属性,然后归一化必须“rescale-symmetric”或者'Rescale-Zero-One'。如果马克斯[],然后软件计算出训练时间的最大值。

您可以在不经过培训创建网络时设置此属性(例如,在使用汇编)。

数据类型:单身的|双倍的|INT8.|int16|INT32.|INT64.|uint8.|uint16|UINT32.|UINT64

请注意

dataaugmentation.建议不建议。与裁剪,反射和其他几何变换的预处理图像,使用AugmentedimageGedataStore.代替。

数据增强转换在培训期间使用,指定为以下之一。

  • “没有”-没有数据扩充

  • 'randcrop'- 从训练图像中随机作物。随机裁剪的大小与输入大小相同。

  • “randfliplr”- 随机地用50%的几率水平翻转输入图像。

  • 单元阵列的'randcrop'“randfliplr”。该软件按照单元格数组中指定的顺序应用增强。

图像数据的增强是减少过拟合的另一种方法[1],[2]

数据类型:细绳|char|细胞

图层名称,指定为字符向量或字符串标量。要在图层图中包含一个图层,必须指定非空,唯一的图层名称。如果您使用该图层培训系列网络名称设定为,然后该软件在训练时自动为该层指定一个名称。

数据类型:char|细绳

层的输入数。该层没有输入。

数据类型:双倍的

图层的输入名称。该层没有输入。

数据类型:细胞

层的输出数。这一层只有一个输出。

数据类型:双倍的

图层的输出名称。这一层只有一个输出。

数据类型:细胞

例子

全部折叠

创建一个图像输入层28 × 28的彩色图像的名称“输入”。默认情况下,该层通过从每个输入图像中减去训练集的平均图像来执行数据归一化。

input = imageInputLayer([28 28 3],“名字”,“输入”)
InputLayer =具有属性的ImageInputlayer:名称:'输入'输入:[28 28 3] HyperParameters Dataaugmentation:'无'归一化:'Zerocenter'普通化Dimension:'Auto'均值:[]

中包含一个图像输入层数组中。

层= [......imageInputLayer([28 28 1])卷积2dlayer (5,20)“步”,2) full connectedlayer (10) softmaxLayer classiationlayer]
图层= 7x1层阵列,图层:1''图像输入28x28x1图像与'zerocenter'归一化2''卷积20 5x5卷积与步幅[1 1]和填充[0 0 0 0] 3''Relu Relu 4''Max汇集2x2 max汇集步进[2 2]和填充[0 0 0 0] 5''完全连接的10完全连接的第6层''softmax softmax 7''分类输出crossentropyex

兼容性的考虑

展开全部

不推荐在R2019B开始

未来发布的行为变化

参考

[1] Krizhevsky,A.,I. Sutskever和G. E. Hinton。“具有深度卷积神经网络的想象成分类”。神经信息处理系统的进步。第25卷2012年。

[2]Cireşan,D.,U.Meier,J. Schmidhuber。“用于图像分类的多列深神经网络”。IEEE计算机视觉与模式识别会议,2012年。

扩展能力

介绍了R2016a