主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

augmentedImageDatastore

バッチバッチの変换によるによるイメージデータの拡

说明

拡張イメージデータストアは,サイズ変更,回転,反転などのオプションの前処理を使用して,学習データ,検証データ,テストデータ,および予測データのバッチを変換します。イメージのサイズを変更して,深層学習ネットワークの入力サイズに適合させます。ネットワークで過適合が発生したり,学習イメージの正確な詳細が記憶されたりすることを防止するには,ランダムな前処理演算を使用して学習イメージデータを拡張します。

拡張イメージを使用してネットワークに学習させるには,augmentedImageDatastoreTrainnetwork.に指定します。详细については,イメージの深层学习习向け向け前を参照してください。

  • 拡张イメージデータストアを习イメージのソースとして使するする场によって各エポックの习データににに各与えられるためためためためためためれれ各各られるためれれ各られるられるられるためためためられるられる场场场実际のはんん。変换変换后のイメージはメモリ格式されません。

  • imageInputLayerは,元のデータセットの平均ではなく拡張イメージの平均を使用してイメージの正規化を行います。この平均は,最初の拡張エポックで1回計算されます。他のすべてのエポックで同じ平均が使用されるため,学習中には平均イメージが変化しません。

既定では,augmentedImageDatastoreはイメージのサイズを出力サイズに合わせて変更します。ImagedataAugmenter.を使用して,追加のイメージ変換のオプションを設定できます。

作成

说明

auimds = augmentedImageDatastore (outputSize,IMDS.は,イメージデータストアIMDS.のイメージを使使用して分享问题问题拡张イメージデータストアを作物OutputSizeプロパティを设定します。

auimds = augmentedImageDatastore (outputSize,Xyは,分享问题および回帰の拡张イメージデータストアをしXにはは子変がれれ,配列yにはカテゴリカルラベルまたはラベルがが含まます。

auimds = augmentedImageDatastore (outputSize,Xは,配列Xのイメージデータの応答を予測するための拡張イメージデータストアを作成します。

auimds = augmentedImageDatastore (outputSize,资源描述は,分類問題および回帰問題用の拡張イメージデータストアを作成します。テーブル资源描述にに,予测子と応答が含まれます。

auimds = augmentedImageDatastore (outputSize,资源描述响应は,分類問題および回帰問題用の拡張イメージデータストアを作成します。テーブル资源描述にに,予测子と応答が含まれます。引数响应は,资源描述のの分数を指定します。

auimds = augmentedimagedataStore(___、名称、值)は,名称と値のペア使使使ColorPreprocessingDataAugmentationoutputsizeMode.,およびDispatchInBackgroundの各プロパティを設定し,拡張イメージデータストアを作成します。複数の名前と値のペアを指定できます。各プロパティ名を引用符で囲みます。

たとえば,myTable augmentedImageDatastore([28日28],“OutputSizeMode”,“centercrop”)は中心からイメージをトリミング拡张イメージデータストアを作物

入力引数

すべて展開する

イメージデータストア。imageageAtastore.オブジェクトとして指定します。

imageageAtastore.をを使と,事前取得を使使てjpgまたはpngイメージのバッチ読み取り行うことができイメージの読み取りカスタムうます。imageageAtastore.は事前取得を行いません。

ヒント

イメージのサイズ変更を含む深层学习用のイメージの前を效率的に行augmentedImageDatastoreを使用します。

imageDatastorereadfcn.オプションは通常,速度が大幅に低下するため,前処理またはサイズ変更に使用しないでください。

イメージ。4次元数値配列として指定します。最初の3つの次元は高さ,幅,およびチャネルであり,最後の次元は個々のイメージにインデックスを付けます。

配列にが含まれる場合,学習全体に伝播されます。ただし,ほとんどの場合に学習が収束しなくなります。

データ型:||uint8|int8|uint16|int16|uint32|int32

分類または回帰の応答。次のいずれかに指定します。

  • 分類問題で,yがイメージラベルを含むカテゴリカルベクトル。

  • 回帰問題では,yは次のいずれかになる。

    • n行r列の数码行.Nは観测値の数,rは応答の数。

    • h x w x c x nの数量配列.h x w xcは1つの応答の,nは観测値の。

応答にがが含まれてていはなりませませ

データ型:分类|

入力データ。テーブルとして指定し。资源描述は,最初の列にに子を,绝対イメージパス,相対イメージパス,あるいはイメージとして含まばばんん。

  • 分别分别问题では,応答はイメージのラベルをカテゴリカルカテゴリカルででばばなりなりませませませませませaugmentedImageDatastoreを呼び出すときに応答変数の名前が指定されていない場合,応答は2列目に含まれていなければなりません。资源描述の异なる列に応答が含まれているいる合,幂数响应を使使し応答応答応答を指定ししばませませんんませませませませませませませませませませ。

  • 回帰問題では,応答は数値であり,最初の列より後の列に含まれなければなりません。応答は,スカラーとして複数の列に,あるいは数値ベクトルまたは3次元数値配列が含まれる细胞配列として1つの列に含めることができます。応答変数の名前を指定しない場合,augmentedImageDatastore资源描述のの残りの列をを応答として受け入れます引引响应を使用して応答変数名を指定できます。

応答にがが含まれてていはなりませませ予測子データにががれる综合,学习繁体に伝播さますが,ほとんどほとんどの合に习が收束しなくます。

データ型:桌子

入力テーブルの応答変数の名前。次のいずれかとして指定します。

  • 1つの応答をもつもつまたはまたはタスクの场合书,响应は,入力テーブルに応答変数が格納された文字ベクトルまたは字符串スカラーでなければなりません。

    复数の応答をもつもつタスクのの合书,响应は,入力テーブルに応答変数が格納された字符串配列または文字ベクトルの细胞配列でなければなりません。

データ型:字符|细胞|字符串

プロパティ

すべて展開する

入力グレースケールまたはrgbイメージに対して実行される色前前定理演算。'没有任何'“gray2rgb”,または“rgb2gray”として指定します。イメージデータストアにグレースケールイメージとrgbイメージが混混在している料,ColorPreprocessingを使使し,すべてのの力イメージがimageInputLayerに必要な数のチャネルを持つようにします。

入入カラーチャネル必要场れれささされれれさされれれなさされれれさされれれささされれれさされれれれさ“gray2rgb”ををしており,入力イメージに既に3つのチャネルがある综合,色色の前定理は行。

メモ

augmentedImageDatastoreオブジェクトは,関数RGB2GRAY.をを使てrgbイメージをグレースケールにしますますます。イメージイメージに,绿,绿のチャネルに対応し3つのチャネルあるあるあるあるあるないないないないがある合(l * a * b *色空间ののなど),ColorPreprocessingを使用すると良い結果が得られないことがあります。

入力イメージが1つまたは3つのチャネルを持たない場合(マルチスペクトルイメージまたはハイパースペクトルイメージの場合など),色の前処理演算は実行されません。この場合,すべての入力イメージが同数のチャネルを持たなければなりません。

データ型:字符|字符串

入力イメージに适适使用ささ前前前。ImagedataAugmenter.オブジェクトまたは'没有任何'として指定します。DataAugmentation'没有任何'であるである合,入力イメージには前が适。

学習,予測,または分類中のバックグラウンドにおける観測値の送信。错误的または真的としてとしてしし。バックバックディスパッチを使使に,并行计算工具箱™が必要です。

拡张イメージデータストア,Trainnetwork.,および预测分类などの推论有关部と共にした合,バックグラウンドディスパッチのみのみ実ししのの关联关系を直接呼び出すと,バックグラウンドディスパッチが行われません。

各各で返される観测値数。データデータの作物小匹匹匹匹配の値を変更できます。学习,予测,および分享では,小匹匹匹匹配プロパティは培训选项で定义されたミニバッチサイズに设定されます。

このプロパティは読み取り専用です。

拡張イメージデータストアに含まれている観測値の合計数。観測値の数は1つの学習エポックの長さです。

出力イメージのサイズ。2つの正の整数のベクトルとして指定します。最初の要素は出力イメージの行数,2番目の要素は列数を指定します。

メモ

イメージ出力サイズを3要素ベクトルとして指定してaugmentedImageDatastoreを作物するする,データストアでは3番目の要素が无视さます。代わり代わり,データデータではColorPreprocessing,OutputSize[28 28 1]に设定しても,ColorPreprocessing“gray2rgb”ににした综合,出力イメージのサイズは28 x 28 x 3になりなり。

出力イメージのサイズ変更に使用するメソッド。次のいずれかに指定します。

  • “调整”- 双一次内插を使し,出力サイズにますてをスケーリングます。

    メモ

    augmentedImageDatastoreは,imresizeの双一次内挿法をアンチエイリアシングと共に使用します。双一次内挿を使用すると,最近傍内挿などによって発生する歪みを回避しながら,イメージ処理を高速化できます。対照的に,imresizeは既定で,双三次内插をアンチと共にと共に使し,サイズ変更された高品质のイメージ生成しが,管理时间ははなります。

  • “centercrop”——学習イメージの中心からトリミングします。トリミングのサイズは,出力サイズと同じです。

  • “randcrop”——学習イメージからランダムにトリミングします。ランダムなトリミングのサイズは,出力サイズと同じです。

データ型:字符|字符串

オブジェクト关节

结合 複数のデータストアのデータを統合
哈迪塔 データが読み取り可かかかを判别
numpartitions データストアの区画数
分区 データストアを分享する
PartitionByIndex. 分区augmentedImageDatastore根据索引
预览 データストア内のデータのサブセットをプレビュー
读取的数据augmentedImageDatastore
读物 データストアのすべてのデータの読み取り
readByIndex 读取由索引指定的数据augmentedImageDatastore
重置 データデータストアのの初状态状态のリセット
洗牌 随机数据库数据augmentedImageDatastore
子集 データストアまたはファイルセットのサブセットを作成
转换 データストアの変换
isPartitionable データストアが分割可能かどうかを判別
isShufflable. データストアがシャッフル可かどうかを

すべて折りたたむ

拡张イメージデータをを使て,畳み込みニューラルネットワークに学习データデータ拡,ネットワークデータ拡は,ネットワークで过过适が生物,学校,学校イメージのたりなが记忆さたりするを防止

标本データをます。标本データは,手书签数码の合成イメージで成されていいい。

[XTrain, YTrain] = digitTrain4DArrayData;

digittrain4darraydata.は,数字の学習セットを4次元配列データとして読み込みます。XTrainは,28 x 28 x 1 x 5000の配列です。

  • 28はイメージの高さ幅。

  • 1はチャネルの数。

  • 5000はは书签数码の合成均匀数。

ytrain.は,各各観测値のラベルが含ま含まれる含まれるベクトルベクトル

ネットワークネットワーク検证用に1000个个のイメージを残しておきおきおきおき

idx = randperm(大小(XTrain, 4), 1000);XValidation = XTrain (:,:,:, idx);XTrain (::,:, idx) = [];YValidation = YTrain (idx);YTrain (idx) = [];

サイズ変更,回転,平行移動,反転など,イメージ拡張の前処理オプションを指定するImagedataAugmenter.オブジェクトを作成します。イメージを那水平方向および垂直方向に最大 3 ピクセルまでのランダムな平行移動をさせたり、最大 20 度までの回転をさせたりします。

imageaugmenter = imagedataAugmenter(...'randroatation'(-20年,20),...“RandXTranslation”3 [3],...'randytranslation'3 [3])
Imageaugmenter = ImagedataAugmenter具有属性:FileValue:0 RandXreflection:0 Randyreflection:0 RandRotation:[-20 20] RANDSCALE:[1] RANDXSCALE:[1] RANDYSCALE:[1] RANDXSHEAR:[0] RANDYSHEAR:[00] RandXTranslation:[-3 3] RandyTranslation:[-3 3]

ネットワーク学习に使使用するaugmentedImageDatastoreオブジェクトイメージ力サイズ指定しし习は,とい,とは,とはます。Trainnetwork.は,ネットワークネットワークパラメーターををを更した,そのその张イメージを破弃ます。

图像= [28 28 1];Augimds = AugmentedimageDataStore(图像化,Xtrain,Ytrain,'dataaugmentation',imageaugmender);

畳み込み畳み込みニューラルネットワークアーキテクチャアーキテクチャを指定しし

[imageInputLayer(imageSize)卷积2dlayer (3,8,“填充”'相同的')BatchnormalizationLayer Ruilulayer MaxPooling2dlayer(2,'走吧',2)卷积2dlayer(3,16,“填充”'相同的')BatchnormalizationLayer Ruilulayer MaxPooling2dlayer(2,'走吧'32岁的,2)convolution2dLayer (3“填充”'相同的') batchNormalizationLayer reluLayer fulllyconnectedlayer (10) softmaxLayer classiationlayer];

モーメンタム项付き确率的勾配勾配の学习习オプションを指定ます。

选择= trainingOptions (“个”...'maxepochs'15岁的...“洗牌”'每个时代'...'plots'“训练进步”...“详细”,错误的,...'vightationdata',{xvalidation,yvalidation});

ネットワークに学習をさせます。検証イメージは拡張されないため,検証精度が学習精度より高くなります。

net = trainnetwork(augimds,图层,选择);

ヒント

  • 关节inmtile.を使用して,変換された多くのイメージを同じ图で可視化できます。たとえば,次のコードは,auimdsという拡張イメージデータストアから,変換されたイメージのミニバッチの1つを表示します。

    minibatch =阅读(auimds);imshow (imtile (minibatch.input))
  • 既定では,イメージに対して実行されるイメージ前処理演算はサイズの変更のみです。名前と値のペアの引数DataAugmentationImagedataAugmenter.オブジェクトオブジェクト使使し,加入の前前演算を有效にします拡拡イメージストアからイメージがにににににに演算なるなるなる组みなるなるなるなるなるわせ各イメージなる组み组みで各异なるなる组みわせ异なるなるれ

R2018aで導入