主要内容

使用深度神经网络的强化学习

通过与未知动态环境的交互来训练深度神经网络代理

强化学习是一种目标导向的计算方法,智能体通过与未知动态环境交互来学习执行任务。在训练过程中,学习算法更新代理策略参数。学习算法的目标是找到一种最优策略,使任务期间收到的长期奖励最大化。

根据代理的类型,策略由一个或多个策略和值函数表示形式表示。你可以使用深度神经网络来实现这些表示。然后,您可以使用强化学习工具箱™软件来训练这些网络。

有关更多信息,请参见使用深度神经网络的强化学习

主题