利用深神经网络加固学习

通过与未知的动态环境进行交互来培训深神经网络代理

加强学习是一种目标定向的计算方法，其中代理学习通过与未知的动态环境进行交互来执行任务。在培训期间，学习算法更新代理策略参数。学习算法的目标是找到最佳策略，最大化任务期间收到的长期奖励。

根据代理类型，策略由一个或多个策略和值函数表示表示。您可以使用深神经网络实现这些表示。然后，您可以使用强化学习工具箱™软件培训这些网络。

话题

强化学习是一种目标定向的计算方法，计算机学习通过与未知的动态环境进行交互来执行任务。

使用钢筋使用在Simulink中建模的工厂培训一个控制器万博1manbetx^®作为培训环境。

使用深度学习工具箱™使用深网络设计器应用程序创建钢筋学习代理。

使用基于图像的观测信号列车钢筋学习代理。

为车道保持辅助应用培训钢筋学习代理。

培训深度神经网络以模仿模型预测控制器的行为。

培训钢筋学习代理以控制飞行机器人模型。

打开直播脚本

培训加固学习代理，以控制建模的Biped行走机器人Simscape™MultiBody™。

打开直播脚本

为适应性巡航控制应用训练钢筋学习代理。

打开直播脚本

培训申请后车道的钢筋学习代理。

打开直播脚本

训练人形机器人使用遗传算法或加强学习来行走。

打开直播脚本

培训钢筋学习代理将汽车停放在开放的停车位。

打开直播脚本