深度学习在FPGA的解决方案
深度学习在现场可编程的门阵列(FPGA)的解决方案为您提供了一个端到端的工作流来编译、部署、配置和调试您的自定义pretrained深度学习网络。您还可以生成一个定制的深度学习处理器IP核可以集成到您的自定义参考设计。
这个图显示了MATLAB®深度学习基于FPGA的解决方案。
工作流程是:
生成外部内存地址映射使用
编译
函数。检索网络层延迟和帧每秒的整体网络性能(FPS)通过使用分析器和调试器。
生成一个自定义的深度学习处理器IP核。
将生成的IP核心集成到您的自定义参考设计。
生成外部内存地址映射使用编译器。检索网络层延迟和帧每秒的整体网络性能(FPS)通过使用分析器和调试器。生成一个自定义的深度学习处理器IP核和生成的IP核心集成到您的自定义参考设计。
基于FPGA的测试深度学习的优点
fpga提供了几个优势在图形处理单元(GPU)深度学习应用。
通过提供高吞吐量和低延迟高绩效。
低功耗,可以调整硬件所需的应用程序。
成本效益,因为你可以额外功能集成在同一芯片,也可以节省成本和板空间。
深度学习在FPGA工作流
基于你的目标,使用这个表中的信息来选择你的工作流。
目标 | 工作流 |
运行一个pretrained系列网络目标FPGA板上。 | 在FPGA原型深入学习网络和SoC设备 |
获得的性能pretrained系列网络处理器预配置的深度学习。 | 深入学习网络的估计性能 |
自定义深度学习处理器来满足您的资源利用的要求。 | 估计配置为定制的处理器资源利用率 |
生成一个自定义的深度学习处理器的FPGA。 | 生成定制的比特流 |
了解你pretrained系列量化网络的好处。 | 量子化的神经网络 |
比较你的量化的准确性pretrained系列网络对单一数据类型pretrained系列网络。 | 验证 |
运行一个量子化pretrained系列网络目标FPGA板上。 | 代码生成和部署 |