深度学习的预处理图像- MATLAB & Simulink - MathWorks Nordi万博1manbetxc

用于深度学习的图像预处理

要训练网络并对新数据进行预测，图像必须与网络的输入大小相匹配。如果需要调整图像大小以匹配网络，则可以将数据重新缩放或裁剪到所需大小。

您可以通过应用随机化方法有效地增加训练数据量增强你的数据。增强还使您能够训练网络，使其对图像数据中的失真保持不变。例如，可以将随机旋转添加到输入图像中，以便网络对输入图像中旋转的存在保持不变。一增强图像数据存储提供了一种方便的方法，将有限的增强集应用于二维图像的分类问题。

对于更高级的预处理操作，如为回归问题预处理图像，或预处理3-D体积图像，可以从内置数据存储开始。您还可以根据您自己的管道使用变换和结合功能。

您可以将图像数据存储为数字数组图像数据存储对象或表。一图像数据存储使您能够从太大而无法放入内存的图像集合中批量导入数据。您可以使用增强的图像数据存储或调整大小的4-D数组进行训练、预测和分类。调整大小的三维数组只能用于预测和分类。

有两种方法可以调整图像数据的大小以匹配网络的输入大小。

调整大小选项	数据格式	调整大小功能	示例代码
重新缩放	表示单色或多光谱图像的三维阵列表示灰度图像堆栈的三维数组表示图像堆栈的4-D数组	`imresize`	im=imresize（I，outputSize）； `输出大小`指定缩放后的图像的尺寸。
重新缩放	表示图像堆栈的4-D数组 `图像数据存储` 表格	`增强图像数据存储`	auimds = augmentedImageDatastore (outputSize,我); `输出大小`指定缩放后的图像的尺寸。
种植	表示单色或多光谱图像的三维阵列	`imcrop`(图像处理工具箱)	im=imcrop（I，rect）； `矩形`指定二维裁剪窗口的大小和位置。
	表示灰度图像堆栈的三维数组表示彩色或多光谱图像堆栈的4-D阵列	`imcrop3`(图像处理工具箱)	im=imcrop3（I，长方体）； `长方体`指定三维裁剪窗口的大小和位置。
	表示图像堆栈的4-D数组 `图像数据存储` 表格	`增强图像数据存储`	auimds = augmentedImageDatastore (outputSize,我,“OutputSizeMode”，m）；具体说明`M`像`“中心作物”`从输入图像的中心进行裁剪。具体说明`M`像`“randcrop”`从输入图像中的随机位置进行裁剪。

对于图像分类问题，可以使用增强图像数据存储使用调整大小、旋转、反射、剪切和平移转换的随机组合来增强图像。

这个图表展示了trainNetwork使用增强图像数据存储来转换每个历元的训练数据。使用数据增强时，在每个训练历元中使用每个图像的一个随机增强版本。有关工作流的示例，请参阅带有增强图像的列车网络．

指定训练图像。
配置图像变换选项，如旋转角度的范围和是否随机应用反射，通过创建图像数据增强器．

提示

要预览应用于示例图像的转换，请使用加强作用
创建一个增强图像数据存储. 指定训练图像、输出图像的大小以及图像数据增强器。输出图像的大小必须与图像的大小兼容图像输入层网络的一部分。
训练网络，指定扩充的图像数据存储作为数据源trainNetwork．对于训练的每次迭代，增强图像数据存储对小批训练数据中的图像应用随机的变换组合。
当您使用扩充图像数据存储作为训练图像的来源时，该数据存储将随机扰动每个epoch的训练数据，因此每个epoch使用略有不同的数据集。每个纪元的实际训练图像数量没有变化。转换后的图像不存储在内存中。

一些数据存储在读取一批数据时执行特定的和有限的图像预处理操作。表中列出了这些特定于应用程序的数据存储。您可以使用这些数据存储作为使用深度学习工具箱™的深度学习应用程序的培训、验证和测试数据集的来源。所有这些数据存储都以支持的格式返回数据万博1manbetxtrainNetwork．

数据存储	描述
`增强图像数据存储`	应用随机仿射几何变换，包括调整大小、旋转、反射、剪切和平移，用于训练深度神经网络。例如，请参见使用预训练网络进行迁移学习．
`像素标签图像数据存储`（计算机视觉工具箱）	对图像和相应的地面真值标签应用相同的仿射几何变换来训练语义分割网络（需要计算机视觉工具箱）™). 有关示例，请参见基于深度学习的语义分割．
`随机抽取数据存储`(图像处理工具箱)	从图像或像素标签图像中提取多对随机patch(需要图像处理工具箱™)。你也可以选择对这对补丁应用相同的随机仿射几何变换。例如，请参见基于深度学习的单幅图像超分辨率处理．
`去噪图像数据存储`(图像处理工具箱)	应用随机生成的高斯噪声训练去噪网络（需要图像处理工具箱）。

要执行比特定于应用程序的数据存储提供的更一般和复杂的图像预处理操作，可以使用变换和结合功能。有关详细信息，请参阅用于深度学习的数据存储．

这个变换函数创建数据存储的改变形式，称为底层数据存储，根据定义的转换函数转换基础数据存储读取的数据。

属性返回的格式中，自定义转换函数必须接受读底层数据存储的功能。的图像数据图像数据存储，格式取决于可读大小所有物

当可读大小为1时，转换函数必须接受整数数组。阵列的大小与中的图像类型一致图像数据存储. 例如，灰度图像具有尺寸M——- - - - - -N，一个真彩色图像有尺寸M——- - - - - -N-by-3的多光谱图像C通道具有尺寸M——- - - - - -N——- - - - - -C．
当可读大小大于1时，转换函数必须接受图像数据的单元格数组。每个元素对应于批处理中的一个图像。