视频y在线研讨会

具有图像数据的倒立摆强化学习

Emmanouil Tzorakoleftherakis, MathWorks

使用Reinforcement Learning Toolbox™和DQN算法对一个简单的钟摆进行基于图像的反演。工作流由以下步骤组成:1)创建环境，2)指定策略表示，3)创建代理，4)训练代理，5)验证训练过的策略。

所提供的钟摆环境具有预定义的观察、行动和奖励。动作包括5个可能的扭矩值，观察包括一个50x50的灰度图像和钟摆的角速率，奖励是从期望的上升位置的距离。学习如何使用Deep Network Designer应用程序构建q函数的神经网络表示，DQN代理使用它来近似长期回报。

了解如何在培训期间可视化摆动行为，并监控培训进度。完成培训后，验证模拟中的策略以决定是否需要进一步培训。

相关产品s manbetx 845

了解更多

¿Qué es强化学习?

加速模型预测控制器的3种方法

读白皮书

深度学习实用指南:从数据到部署

读电子书

用MATLAB桥接无线通信设计与测试

读白皮书

深度学习与传统机器学习:选择正确的方法

读电子书

电力电子控制设计中的硬件在环测试

读白皮书

基于MATLAB的预测维护

读电子书

电动汽车建模与仿真-架构到部署:网络研讨会系列

免费注册

你对能量转换控制了解多少?

开始测试

相关信息

开始强化学习匝道

特色产品

强化学习工具箱

下一个:

汽车产品开发的最佳神经网络

相关视频:

基于SimMechanics和QUARC的倒立摆控制

信号处理和机器学习技术…

使用图像来查看数据而不是浏览和查看(2)

物理建模:建立一个旋转摆

查看更多相关视频