主要内容

MATLAB环境

利用MATLAB建立强化学习环境动力学模型®

在强化学习场景中,环境建模与代理交互的动态。环境:

  1. 从代理接收动作

  2. 输出来自环境模型动态行为的观察结果

  3. 产生奖励,衡量行动对完成任务的贡献程度

您可以在MATLAB中创建预定义和自定义环境。有关更多信息,请参阅创建MATLAB强化学习环境

功能

全部展开

rlPredefinedEnv 创建一个预定义的强化学习环境
rlfunctionenv. 使用函数指定自定义强化学习环境动态
rlCreateEnvTemplate 创建自定义强化学习环境模板
rlMDPEnv 创建强化学习的马尔科夫决策过程环境
createMDP 建立马尔科夫决策过程模型
createGridWorld 创建一个二维网格世界来加强学习
validateEnvironment 验证自定义强化学习环境
rlFiniteSetSpec 为强化学习环境创建离散的行动或观察数据规范
rlNumericSpec 为强化学习环境创建持续的行动或观察数据规范
getActionInfo 从强化学习环境或代理获取行动数据规范
getObservationInfo 从强化学习环境或agent中获取观测数据规范

主题

创建MATLAB强化学习环境

使用与代理交互的MATLAB对象对环境动力学进行建模,生成响应代理行为的奖励和观察。

为强化学习设计创建MATLAB环境

导入自定义环境或创建预定义环境。

定义奖励信号

创造一个奖励信号来衡量代理人实现目标的成功程度。

加载预定义的控制系统环境

您可以在预定义的MATLAB控制系统环境中训练代理,其中的动作、观察、奖励和动态已经定义。

加载预定义的网格世界环境

您可以在预定义的MATLAB网格世界环境中训练代理,其中的动作、观察和奖励已经定义。

创建自定义网格世界环境

您可以通过定义自己的大小、奖励和障碍来创建自定义的MATLAB网格世界环境。

创建MATLAB环境使用自定义函数

通过提供定制的动态功能来创建强化学习环境。

从模板创建自定义MATLAB环境

通过创建和修改模板环境对象,可以自定义强化学习环境。