视频和网络研讨会

行走机器人的深度强化学习

从系列中:建模、仿真与控制

塞巴斯蒂安·卡斯特罗，MathWorks

Sebastian Castro演示了一个使用深度强化学习控制类人机器人运动的例子，特别是深度确定性策略梯度(DDPG)算法。机器人使用Simscape Multibody™进行模拟，而控制策略的训练则使用Reinforcement Learning Toolbox™进行。

在这个视频中，Sebastian概述了使用Simulink进行强化学习的设置、训练和评估万博1manbetx^®模型。首先，他介绍了如何为强化学习问题选择状态、行动和奖励函数。然后描述了神经网络的结构和训练算法参数。最后，他展示了一些训练结果，并讨论了强化学习的优点和缺点。

您可以在本视频中使用的示例模型MATLAB中央文件交换．

有关更多信息，您可以访问以下资源:

相关产品s manbetx 845

强化学习工具箱

了解更多

联系MathWorks学生竞赛团队

为你的学生竞赛申请软件

为学生观看相关视频

3种方法加速模型预测控制器

阅读白皮书

深度学习实践指南:从数据到部署

读电子书

基于MATLAB的桥接无线通信设计与测试

阅读白皮书

深度学习与传统机器学习:选择正确的方法

读电子书

电力电子控制设计的硬件在环测试

阅读白皮书

基于MATLAB的预测性维护

读电子书

电动汽车建模与仿真-架构到部署:网络研讨会系列

免费注册

你对电源转换控制了解多少?

开始测试

相关信息

从强化学习入口开始

特色产品

强化学习工具箱

下一个:

学习如何使用线性倒立摆模型(LIPM)在MATLAB和Simulink中设计人形行走模式。万博1manbetx

基于模型的人形行走控制

查看完整系列(18个视频)

相关视频:

确定风力涡轮机的机械载荷

计算机视觉的深度学习

基于MATLAB的计算机视觉深度学习(重点介绍)

基于项目的学习:学生学习如何更好地使用…

MATLAB满足头脑风暴:如何控制乐高NXT机器人…

查看更多相关视频