主要内容

MATLAB环境

基于MATLAB的强化学习环境动力学模型®

在强化学习场景中,环境对agent交互的动力学进行建模。环境:

  1. 从代理接收操作

  2. 输出由环境模型的动态行为产生的观察结果

  3. 产生奖励,衡量行动对完成任务的贡献程度

您可以在MATLAB中创建预定义和自定义环境。有关更多信息,请参阅创建MATLAB强化学习环境.

功能

全部展开

rlPredefinedEnv 创建预定义的强化学习环境
rlfunctionenv. 使用函数指定自定义强化学习环境动力学
rlCreateEnvTemplate 创建自定义强化学习环境模板
rlMDPEnv 为强化学习创建马尔可夫决策过程环境
创建MDP 马尔可夫决策过程模型的建立
createGridWorld 为强化学习创建二维网格世界
验证环境 验证自定义强化学习环境
rlFiniteSetSpec 为强化学习环境创建离散行动或观察数据规范
rlNumericSpec 为强化学习环境创建持续行动或观察数据规范
getActionInfo 从强化学习环境或代理获取行动数据规范
获取观测信息 从强化学习环境或代理获取观察数据规范

话题

创建MATLAB强化学习环境

使用与agent交互的MATLAB对象对环境动力学进行建模,生成对agent操作的回报和观察结果。

为强化学习设计器创建MATLAB环境

导入自定义环境或创建预定义环境。

定义奖励信号

创建一个奖励信号,用于衡量代理在实现其目标方面的成功程度。

加载预定义的控制系统环境

您可以在预定义的MATLAB控制系统环境中培训代理,这些环境中已经定义了操作、观察、奖励和动态。

加载预定义的网格世界环境

您可以在预定义的MATLAB网格世界环境中培训代理,这些环境中已经定义了操作、观察和奖励。

创建自定义网格世界环境

您可以通过定义自己的大小、奖励和障碍来创建自定义的MATLAB网格世界环境。

使用自定义函数创建MATLAB环境

通过提供自定义动态功能创建强化学习环境。

从模板创建自定义MATLAB环境

可以通过创建和修改模板环境对象来定义自定义强化学习环境。