主要内容

万博1manbetx环境

利用Simulink建立强化学习环境动力学模型万博1manbetx®模型

在强化学习场景中,环境建模与代理交互的动态。环境:

  1. 从代理接收动作

  2. 输出来自环境模型动态行为的观察结果

  3. 产生奖励,衡量行动对完成任务的贡献程度

您可以使用Simulink模型创建预定义和自定义环境。万博1manbetx有关更多信息,请参见创建Simul万博1manbetxink强化学习环境

功能

全部展开

rlPredefinedEnv 创建一个预定义的强化学习环境
rl万博1manbetxSimulinkEnv 使用中实现的动态模型创建强化学习环境万博1manbetx
createIntegratedEnv 创建万博1manbetx强化学习的模型,使用参考模型作为环境
validateEnvironment 验证自定义强化学习环境
万博1manbetxSimulinkEnvWithAgent 用动态模型实现强化学习环境万博1manbetx
rlFiniteSetSpec 为强化学习环境创建离散的行动或观察数据规范
rlNumericSpec 为强化学习环境创建持续的行动或观察数据规范
getActionInfo 从强化学习环境或agent获取动作数据规范
getObservationInfo 从强化学习环境或agent中获取观测数据规范
bus2RLSpec 为元素创建强化学习数据规范万博1manbetx公共汽车

RL代理 强化学习代理

主题

创建Simul万博1manbetxink强化学习环境

使用与代理交互的Simulink模型对环境动态进行建模,生成响应代理动万博1manbetx作的奖励和观察。

为强化学习设计万博1manbetx器创建Simulink环境

导入自定义环境或创建预定义环境。

定义奖励信号

创造一个奖励信号来衡量代理人实现目标的成功程度。

加载预定义的Simulink环境万博1manbetx

您可以在预先定义了动作、观察、奖励和动态的Simulink模型的环境中训练代理。万博1manbetx

水箱强化学习环境模型

创建一个强化学习Simulink环境,其中包含一个RL Agen万博1manbetxt块来代替水箱中的水位控制器。