主要内容

量化、投影和修剪

压缩深神经网络进行量化,投影,或修剪

使用深度学习工具箱™一起深度学习工具箱量化模型库万博1manbetx支持包减少内存占用和计算需求的深层神经网络:

  • 修剪过滤器从卷积层利用一阶泰勒近似。然后您可以生成C / c++或者CUDA®从这个修剪网络代码。

  • 预测层进行主成分分析(PCA)层激活使用一个数据集训练数据的代表和层可学的应用线性预测参数。向前传球的预测深层神经网络通常更快部署网络嵌入式硬件时使用library-free C / c++代码生成。

  • 量化权重、偏见和激活层减少精度整数数据类型。然后您可以生成C / c++, CUDA或HDL代码从这个量子化的网络。

    C / c++和CUDA代码生成卷积深层神经网络的软件生成代码通过量化权重,偏见,和卷积的激活层8位整数数据类型。量化是通过提供校准执行的结果文件产生的校准函数codegen(MATLAB编码器)命令。

    代码生成不支持量化深度产生的神经网络万博1manbetx数字转换函数。

功能

全部展开

taylorPrunableNetwork 网络可以利用一阶泰勒近似修剪
向前 计算深度学习网络输出进行训练
预测 计算深度学习网络输出推理
updatePrunables 把过滤器从prunable层基于重要性分数
updateScore 计算和积累Taylor-based重要性分数修剪
dlnetwork 深入学习网络定制培训循环
compressNetworkUsingProjection 压缩使用投影神经网络
neuronPCA 主成分分析的神经元激活
dlquantizer 数字转换深神经网络对8位整数数据类型
dlquantizationOptions 选择量化一个训练有素的深层神经网络
校准 模拟并收集范围的神经网络
数字转换 数字转换深层神经网络
验证 数字转换和验证神经网络
quantizationDetails 显示量化神经网络的详细信息
estimateNetworkMetrics 估计网络指标为特定层的神经网络
equalizeLayers 平衡层深层神经网络的参数

应用程序

深层网络量化器 数字转换深神经网络对8位整数数据类型

主题

修剪

投影

深度学习量化

量化为GPU的目标

量化为FPGA的目标

量化为CPU的目标