batchnorm
语法
描述
批处理规范化操作可实现输入数据在所有观测每个通道独立。加快卷积神经网络的训练,减少对网络的初始化,使用批量规范化卷积和非线性等操作线性整流函数(Rectified Linear Unit)
。
正常化后,操作改变输入可学的抵消β可学的比例因子和尺度γ。
的batchnorm
功能适用于批量标准化操作dlarray
数据。使用dlarray
更易于处理高维数据的对象允许您标签的尺寸。例如,您可以标签尺寸对应于空间,时间,频道,使用批处理维度“S”
,“T”
,“C”
,“B”
标签,分别。未指明的和其他维度,使用“U”
标签。为dlarray
对象的函数操作特定的尺寸,你可以指定尺寸标签的格式dlarray
直接对象,或通过使用DataFormat
选择。
请注意
申请批内规范化layerGraph
对象或层
数组,使用batchNormalizationLayer
。
批处理规范化操作适用于输入数据Y
= batchnorm (X
,抵消
,scaleFactor
)X
使用输入数据的总体均值和方差和指定的偏移量和比例因子。
函数使在规范化“年代”
(空间),“T”
(时间),“B”
(批处理),“U”
(不明)的尺寸X
每个通道的“C”
独立(频道)维度。
无格式的输入数据,使用“DataFormat”
选择。
(
适用于批量标准化操作并返回输入数据的总体均值和方差Y
,popMu
,popSigmaSq
)= batchnorm (X
,抵消
,scaleFactor
)X
。
(
适用于批量标准化操作并返回更新后的移动均值和方差的统计数据。Y
,updatedMu
,updatedSigmaSq
)= batchnorm (X
,抵消
,scaleFactor
,runningMu
,runningSigmaSq
)runningMu
和runningSigmaSq
之前的培训后的均值和方差值迭代,分别。
使用这种语法来维持运行值的均值和方差统计在训练。当你已经完成了培训,使用最后的更新值的均值和方差批规范化操作在预测和分类。
适用于批量标准化操作使用的意思Y
= batchnorm (X
,抵消
,scaleFactor
,trainedMu
,trainedSigmaSq
)trainedMu
和方差trainedSigmaSq
。
使用这种语法在分类和预测,trainedMu
和trainedSigmaSq
最终值的均值和方差完成培训后,分别。
(___)= batchnorm (___,
使用一个或多个指定附加选项名称-值对参数。例如,名称,值
)“MeanDecay”, 0.3
集的衰变速率移动平均计算。
例子
输入参数
输出参数
算法
批处理规范化操作可实现元素x我的输入,首先计算的意思μB和方差σB2在空间、时间和观察每个通道独立维度。然后,计算归一化激活
在哪里ϵ是一个常数,提高数值稳定时方差很小。
允许输入的可能性为零均值和单位方差不是最佳的操作遵循批正常化,批处理规范化操作进一步转变和尺度转换激活使用
的偏移量β和规模因素γ在网络训练可学的参数更新。
进行预测和网络训练后,批规范化需要一个固定的均值和方差标准化数据。这个固定的均值和方差可以计算从训练数据训练后,或近似在训练使用运行统计计算。