加强学习

本系列提供了强化学习的概述,一种机器学习,有可能解决一些难以解决传统技术解决的控制系统问题。

我们将介绍强化问题的基础知识以及它与传统控制技术的不同之处。我们将展示为什么神经网络用于表示未知功能以及代理商如何使用环境中的奖励来培训它们。

到本系列结束时,您将更好地准备回答问题:

  • 什么是加强学习,为什么要在解决我的控制问题时要考虑它?
  • 如何建立并解决强化学习问题?
  • 与传统的控制方法相比,强化学习的一些好处和缺点是什么?

第1部分:什么是加强学习?从工程师的角度概述加强学习。强化学习是一种机器学习,有可能解决一些真正的难控制问题。

第2部分:了解环境和奖励在此视频中,我们通过探索工作流程对强化学习的基本了解。环境是什么?奖励功能如何激励和代理人?政策是如何结构化的?

第3部分:政策和学习算法此视频提供驻留在代理中的算法的介绍。我们将介绍为什么我们使用神经网络代表函数以及为什么您可能必须在一个名为Actor-Reast的强大的方法中设置两个神经网络。

第4部分:行走机器人问题此视频显示如何使用加强学习工作流程来获取BipeDal Robot走路,以及我们如何通过向设计添加参考信号来设置RL问题以看起来更像传统的控制问题。

第5部分:克服加强学习的实际挑战在使用生产系统的加固学习时,存在一些挑战,并且有一些方法可以减轻它们。此视频涵盖验证所学到的解决方案以及您可以做些什么的困难。