主要内容

利用深神经网络加固学习

通过与未知的动态环境进行交互来培训深神经网络代理

加强学习是一种目标定向的计算方法,其中代理学习通过与未知的动态环境进行交互来执行任务。在培训期间,学习算法更新代理策略参数。学习算法的目标是找到最佳策略,最大化任务期间收到的长期奖励。

根据代理类型,策略由一个或多个策略和值函数表示表示。您可以使用深神经网络实现这些表示。然后,您可以使用强化学习工具箱™软件培训这些网络。

有关更多信息,请参阅利用深神经网络加固学习

话题

利用深神经网络加固学习

强化学习是一种目标定向的计算方法,计算机学习通过与未知的动态环境进行交互来执行任务。

创建Simul万博1manbetxink环境和培训代理

使用钢筋使用在Simulink中建模的工厂培训一个控制器万博1manbetx®作为培训环境。

使用深网络设计师创建代理和使用图像观察

使用深度学习工具箱™使用深网络设计器应用程序创建钢筋学习代理。

培训DDPG代理以摇摆和平衡钟摆的图像观察

使用基于图像的观测信号列车钢筋学习代理。

使用并行计算的车道保持辅助列车DQN代理

为车道保持辅助应用培训钢筋学习代理。

模仿MPC控制器,用于车道保持辅助

培训深度神经网络以模仿模型预测控制器的行为。

特色例子