主要内容

为深度学习预处理图像

为了训练网络并对新数据进行预测,你的图像必须与网络的输入大小匹配。如果您需要调整图像的大小以匹配网络,那么您可以调整或裁剪您的数据到所需的大小。

您可以通过应用随机的方法有效地增加训练数据量增加你的数据。增强还可以使你训练网络对图像数据的失真不变性。例如,您可以为输入图像添加随机旋转,这样网络对于输入图像中的旋转是不变的。一个augmentedImageDatastore提供了一种方便的方法,将有限的一组增广应用于二维图像的分类问题。

对于更高级的预处理操作,如对回归问题的图像进行预处理,或对3-D体积图像进行预处理,可以从内置数据存储开始。属性还可以根据自己的管道对图像进行预处理变换结合功能。

使用缩放和裁剪调整图像大小

可以将图像数据存储为数字数组ImageDatastore对象或表。一个ImageDatastore允许您从图像集合中批量导入数据,这些数据太大而无法装入内存。可以使用增强的图像数据存储或调整大小的4-D阵列进行训练、预测和分类。您可以使用调整大小的3-D数组仅用于预测和分类。

有两种方法可以调整图像数据的大小以匹配网络的输入大小。

  • 重新缩放将图像的高度和宽度乘以一个比例因子。如果在垂直和水平方向上缩放因子不相同,那么重新缩放将改变像素的空间范围和长宽比。

  • 裁剪提取图像的一个子区域,并保留每个像素的空间范围。您可以从中心或从图像中的随机位置裁剪图像。

调整选项 数据格式 调整功能 示例代码
重新调节
  • 代表单一颜色或多光谱图像的三维阵列

  • 表示灰度图像堆栈的三维阵列

  • 4-D数组表示一堆图像

imresize

我= imresize(我outputSize);

outputSize指定重新缩放图像的尺寸。

  • 4-D数组表示一堆图像

  • ImageDatastore

  • 表格

augmentedImageDatastore

auimds = augmentedImageDatastore (outputSize,我);

outputSize指定重新缩放图像的尺寸。

裁剪
  • 代表单一颜色或多光谱图像的三维阵列

imcrop(图像处理工具箱)

我= imcrop(我、矩形);

矩形指定二维裁剪窗口的大小和位置。

  • 表示灰度图像堆栈的三维阵列

  • 代表一堆彩色或多光谱图像的4-D阵列

imcrop3(图像处理工具箱)

我= imcrop3(我、长方体);

长方体指定三维裁剪窗口的大小和位置。

  • 4-D数组表示一堆图像

  • ImageDatastore

  • 表格

augmentedImageDatastore

auimds = augmentedImageDatastore (outputSize,我,“OutputSizeMode”, m);

指定作为“centercrop”从输入图像的中心进行裁剪。

指定作为“randcrop”从输入图像中的随机位置进行裁剪。

增强图像训练与随机几何变换

对于图像分类问题,您可以使用augmentedImageDatastore通过随机组合调整大小、旋转、反射、剪切和平移变换来增强图像。

该图显示了如何trainNetwork使用一个增强的图像数据存储转换每个epoch的训练数据。当您使用数据增强时,在训练的每个阶段都会使用每个图像的一个随机增强版本。有关工作流的示例,请参见增强图像的火车网络

  1. 指定训练图像。

  2. 配置图像转换选项,如旋转角度的范围和是否随机应用反射,通过创建imageDataAugmenter

    提示

    要预览应用于样本图像的转换,请使用增加函数。

  3. 创建一个augmentedImageDatastore.指定训练图像、输出图像的大小和imageDataAugmenter.输出图像的大小必须与图片的大小一致imageInputLayer的网络。

  4. 训练网络,指定增强图像数据存储作为数据源trainNetwork.对于每次训练迭代,增强图像数据存储对训练数据小批处理中的图像应用变换的随机组合。

    当您使用增强图像数据存储作为训练图像的来源时,数据存储会随机扰动每个epoch的训练数据,以便每个epoch使用略微不同的数据集。每个时期训练图像的实际数量不改变。转换后的图像不存储在内存中。

使用内置数据存储执行其他图像处理操作

一些数据存储在读取一批数据时执行特定的、有限的图像预处理操作。表中列出了这些特定于应用程序的数据存储。您可以将这些数据存储用作使用deep learning Toolbox™的深度学习应用程序的培训、验证和测试数据集的来源。所有这些数据存储都以以下格式返回数据万博1manbetxtrainNetwork

数据存储 描述
augmentedImageDatastore 应用随机仿射几何变换,包括调整大小、旋转、反射、剪切和平移,用于训练深度神经网络。例如,请参见利用训练前网络进行迁移学习
pixelLabelImageDatastore(计算机视觉工具箱) 将相同的仿射几何变换应用于图像和相应的ground truth标签,以训练语义分割网络(需要计算机视觉工具箱™)。例如,请参见基于深度学习的语义切分
randomPatchExtractionDatastore(图像处理工具箱) 从图像或像素标签图像中提取多对随机补丁(需要图像处理工具箱™)。你可以选择应用相同的随机仿射几何变换对补丁。例如,请参见利用深度学习的单幅图像超分辨率
denoisingImageDatastore(图像处理工具箱) 应用随机生成的高斯噪声训练去噪网络(需要图像处理工具箱)。

使用组合和变换应用自定义图像处理管道

要执行比特定于应用程序的数据存储提供的更一般、更复杂的映像预处理操作,可以使用变换结合功能。有关更多信息,请参见用于深度学习的数据存储

使用图像数据转换数据存储

变换函数创建数据存储的更改形式,称为底层数据存储,根据您定义的转换函数转换底层数据存储读取的数据。

控件返回的格式的自定义转换函数必须接受数据底层数据存储的功能。中的图像数据ImageDatastore,格式取决于ReadSize财产。

  • ReadSize为1时,转换函数必须接受整数数组。数组的大小与图像的类型一致ImageDatastore.例如,灰度图像有维度——- - - - - -n,真彩色图像具有维度——- - - - - -n-by-3,多光谱图像c渠道有尺寸——- - - - - -n——- - - - - -c

  • ReadSize大于1时,转换函数必须接受单元数组的图像数据。每个元素对应于批处理中的一个图像。

变换函数必须返回与网络输入大小匹配的数据。的变换函数不支持一对多的观察映射。万博1manbetx

提示

变换函数支持预取,当底万博1manbetx层ImageDatastore读取一批JPG或PNG图像文件。对于这些图像类型,不要使用readFcn的观点ImageDatastore应用图像预处理,因为这个选项通常要慢得多。如果使用自定义读取函数,那么ImageDatastore不预取。

结合数据存储和图像数据

结合函数连接从多个数据存储读取的数据,并维护数据存储之间的校验。

  • 将数据连接到一个两列表或两列单元阵列,用于具有单一输入的训练网络,例如图像到图像回归网络。

  • 将数据连接到(numInputs+1)-列单元阵列训练网络与多个输入。

另请参阅

||||

相关的例子

更多关于