使用GPU实现深度学习申请NVIDIA GPU编码器
GPU编码器™生成可读和便携式CUDA®利用CUDA的代码库cuBLAS和cuDNN MATLAB®算法,然后NVIDIA交叉编译和部署®gpu的特斯拉®嵌入式的杰森™平台。
这个演讲的第一部分描述了如何使用MATLAB设计和原型的端到端系统,包括一个深入学习网络增强与计算机视觉算法。您将了解相应的MATLAB来访问和管理大型数据集,以及pretrained模型快速开始使用深度学习设计。然后,您将看到如何分布和GPU计算能力结合MATLAB受聘期间培训,调试和验证网络的。最后,大多数的端到端系统需要的不仅仅是分类:需要预处理和数据进行后期处理之前和之后的分类。结果通常是输入一个下游控制系统。这些传统的计算机视觉和控制算法,用MATLAB编写的,用于界面的深度学习网络建立端到端系统。
这个演讲的第二部分着重于嵌入式部署阶段。使用自动驾驶的代表性的例子来说明整个工作流,看看GPU编码器自动分析您的MATLAB算法(a)分区MATLAB算法之间的CPU / GPU执行;(b)推断出内存的依赖性;(c)分配到GPU内存层次结构(包括全球、地方、共享和常量记忆);(d)最小化数据传输和device-synchronizations CPU和GPU之间;最后(e)生成CUDA的代码优化利用CUDA库cuBLAS和cuDNN提供高性能。
最后,你会发现生成的代码与基准高度优化表明深度学习推理代码自动生成的CUDA的性能是mxNet快~ 2.5倍,Caffe2 ~快5倍,TensorFlow ~快7倍®。
学习如何看这个演讲:
1。访问和管理大型图像集
2。可视化网络和洞察的训练过程
3所示。导入参考网络AlexNet和GoogLeNet等
4所示。自动生成可移植和优化CUDA代码从MATLAB算法
你可以找到代码示例中使用的网络研讨会的一部分航运的例子GPU编码器。
相关产品s manbetx 845
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。