비디오및웨비나

深强化学习的步行机器人

从系列：建模，仿真与控制

塞巴斯蒂安·卡斯特罗演示了使用深强化学习，特别是深确定性政策梯度（DDPG）算法控制类人机器人运动的一个例子。该机器人使用的Simscape多体™模拟，同时培养控制策略是使用强化学习工具箱™完成。

在这部影片中，塞巴斯蒂安概述了安装，培训和使用Simulink强化学习的评价万博1manbetx^®楷模。首先，他介绍了如何选择状态，动作，以及强化学习问题的奖励功能。接着，他介绍了神经网络结构和训练算法参数。最后，他展示了一些训练成果，并讨论了效益和强化学习的缺点。

您可以在本视频中找到示例模型MATLAB中央文件交换。

欲了解更多信息，可以访问以下资源：

相关产品s manbetx 845

了解更多

联系MathWorks的学生竞赛团队

为你的学生比赛申请软件

关注学生的相关视频

加速模型预测控制器的3种方法

读白皮书

实用指南深度学习：从数据到部署

阅读电子书

使用MATLAB桥接无线通信设计和测试

读白皮书

深度学习和传统机器学习：选择正确的方法

阅读电子书

电力电子控制设计的硬件循环测试

读白皮书

用matlab预测维护

阅读电子书

电动汽车建模与仿真 - 架构部署：系列网络研讨会

免费注册

你对能量转换控制了解多少?

开始测验

相关信息

相关信息

开始使用强化学习匝道

特色产品

加固学习工具箱

下一个：

了解如何线性倒立摆模型（LIPM）可以被用来设计MATLAB和Simulink仿人行走模式。万博1manbetx

仿人步行的基于模型的控制

查看完整系列(18个视频)

有关的影片：

确定机械负载风力发电机组

深度学习计算机视觉

基于MATLAB的计算机视觉深度学习(亮点)

基于项目的学习：学生学习如何更好地使用...

MATLAB会见MINDSTORMS：如何控制NXT乐高机器人...

查看更多相关视频