主要内容

使用深层神经网络的强化学习

通过与未知的动态环境互动来训练深神经网络代理

强化学习是一种目标指导的计算方法,代理商通过与未知的动态环境进行交互来学习执行任务。在培训期间,学习算法更新代理策略参数。学习算法的目的是找到一项最佳政策,以最大程度地利用任务期间获得的长期奖励。

根据代理的类型,该策略由一个或多个策略和价值功能表示形式表示。您可以使用深层神经网络实施这些表示。然后,您可以使用增强学习Toolbox™软件训练这些网络。

有关更多信息,请参阅使用深层神经网络的强化学习

话题