MATLAB环境
使用MATLAB模型强化学习环境动力学®
在强化学习的情况下,环境模型的动态代理进行交互。环境:
从代理接收行为
造成输出观测环境的动态行为模型
生成一个奖励测量的行动有助于实现这一任务
您可以创建预定义和自定义在MATLAB环境中。有关更多信息,请参见创建MATLAB强化学习环境。
功能
主题
- 创建MATLAB强化学习环境
使用MATLAB环境动力学模型与代理交互的对象,产生回报和观察代理人的行为的反应。
- 创建或导入MATLAB环境强化学习设计师
导入一个定制的MATLAB环境或创造一个预定义的MATLAB环境。
- 定义奖励信号
创建一个奖励的信号,衡量成功的代理是在实现其目标。
- 负载预定义的控制系统环境
负载预定义的MATLAB控制系统环境。
- 网格负载预定义的世界环境
火车代理世界上预定义的MATLAB网格环境的操作,观察,和奖励已经定义。
- 创建自定义网格的世界环境
创建自定义网格MATLAB世界环境通过定义自己的大小,奖励和障碍。
- 创建MATLAB环境中使用自定义函数
创建一个强化学习环境提供定制的动态功能。
- 从模板创建定制的MATLAB环境
定义一个自定义强化学习环境通过创建和修改模板环境对象。