从系列:建模、仿真与控制
Sebastian Castro演示了一个使用深度强化学习控制人形机器人运动的例子,特别是深度确定性策略梯度(DDPG)算法。使用Simscape Multibody™对机器人进行模拟,同时使用Reinforcement Learning Toolbox™对控制策略进行训练。
在本视频中,Sebastian概述了使用Simulink进行强化学习的设置、培训和评估万博1manbetx®模型。首先,他介绍了如何为强化学习问题选择状态、行动和奖励函数。然后描述了神经网络的结构和训练算法参数。最后,他展示了一些训练结果,并讨论了强化学习的优点和缺点。
您可以在本视频中找到示例模型MATLAB中央文件交换.
欲了解更多信息,请访问以下资源:
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。