视频等网络研讨会

步行机器人的深度强化学习

从系列:建模、仿真与控制

Sebastian Castro演示了一个使用深度强化学习控制人形机器人运动的例子，特别是深度确定性策略梯度(DDPG)算法。使用Simscape Multibody™对机器人进行模拟，同时使用Reinforcement Learning Toolbox™对控制策略进行训练。

在本视频中，Sebastian概述了使用Simulink进行强化学习的设置、培训和评估万博1manbetx^®模型。首先，他介绍了如何为强化学习问题选择状态、行动和奖励函数。然后描述了神经网络的结构和训练算法参数。最后，他展示了一些训练结果，并讨论了强化学习的优点和缺点。

您可以在本视频中找到示例模型MATLAB中央文件交换．

欲了解更多信息，请访问以下资源:

相关产品s manbetx 845

了解更多

联系MathWorks学生竞赛团队

为你的学生比赛申请软件

为学生观看相关视频

加速模型预测控制器的3种方法

读白皮书

深度学习实用指南:从数据到部署

读电子书

用MATLAB桥接无线通信设计与测试

读白皮书

深度学习与传统机器学习:选择正确的方法

读电子书

电力电子控制设计中的硬件在环测试

读白皮书

基于MATLAB的预测维护

读电子书

电动汽车建模与仿真-架构到部署:网络研讨会系列

免费注册

你对能量转换控制了解多少?

开始测试

相关信息

相关信息

开始强化学习匝道

特色产品

强化学习工具箱

下一个:

学习如何利用线性倒立摆模型(LIPM)在MATLAB和Simulink中设计仿人行走模式。万博1manbetx

基于模型的仿人行走控制

查看完整的系列(18个视频)

相关视频:

确定风力涡轮机的机械负荷

计算机视觉的深度学习

基于MATLAB的计算机视觉深度学习(亮点)

2小时37分跑完

基于项目的学习:学生学习如何更好地使用…

MATLAB满足MINDSTORMS:如何控制LEGO NXT机器人…

查看更多相关视频