独立地对每个通道的所有观测值进行归一化
批处理标准化操作独立地对每个通道的所有观测值的输入数据进行标准化。为了加快卷积神经网络的训练速度并降低对网络初始化的敏感性,在卷积和非线性操作(如雷卢
.
标准化后,操作将输入移动一个可学习的偏移量β并通过可学习的比例因子对其进行缩放γ.
这个批次标准
函数将批处理规范化操作应用于dlarray
数据使用dlarray
对象允许您标记标注,从而使处理高维数据变得更容易。例如,您可以使用标签标记哪些标注对应于空间、时间、通道和批次标注'S'
,“不”
,“C”
和“B”
标签。对于未指定尺寸和其他尺寸,请使用“你”
标签对于dlarray
对于在特定标注上操作的对象函数,可以通过格式化dlarray
对象,或使用“数据格式”
选项
批处理规范化操作规范化元素x我通过首先计算平均值来计算输入的μB和方差σB2.在每个通道的空间、时间和观测维度上独立进行。然后,它计算标准化激活,如下所示:
哪里ϵ是一个常数,在方差非常小时可提高数值稳定性。
考虑到平均值和单位方差为零的输入对于批次标准化之后的操作不是最优的可能性,批次标准化操作使用转换进一步移动和缩放激活
偏移量在哪里β比例因子γ是在网络培训期间更新的可学习参数。
为了在训练后使用网络进行预测,批量标准化需要一个固定的均值和方差来标准化数据。这个固定的均值和方差可以从训练后的训练数据中计算出来,或者在训练期间使用运行统计计算来近似。