主要内容

万博1manbetx环境

使用Simulink模型强化学习环境动态万博1manbetx®楷模

在加强学习场景中,环境模拟了代理交互的动态。环境:

  1. 从代理商接收行动

  2. 输出由环境模型的动态行为产生的观察

  3. 生成奖励测量的行动有助于实现任务的贡献

您可以使用Simulink模型创建预定义和自定义环境。万博1manbetx有关更多信息,请参阅创建Simul万博1manbetxink强化学习环境

职能

展开全部

Rlpredefinedenv. 创建预定义的钢筋学习环境
Rl万博1manbetxsimulinkenv. 使用IN实现的动态模型创建强化学习环境万博1manbetx
CreateIntegrateenv. 创建万博1manbetx钢筋学习模型,使用参考模型作为环境
验证环境 验证定制增强学习环境
万博1manbetxSimulinkenvwithagent. 具有动态模型的强化学习环境万博1manbetx
rlfinitesetspec. 为强化学习环境创建离散动作或观察数据规范
rlnumericspec. 为强化学习环境创建连续动作或观察数据规范
getActionInfo. 从强化学习环境或代理获取行动数据规范
getobservationInfo. 从强化学习环境或代理获得观察数据规范
bus2rlspec. 为一个元素创建强化学习数据规范万博1manbetx公共汽车

RL代理人 加固学习代理

话题

创建Simul万博1manbetxink强化学习环境

模型环境动态使用Simulink模型与代理交互,以响应代理操作而生成奖万博1manbetx励和观察。

为强化学习设计万博1manbetx师创建Simulink环境

导入自定义环境或创建预定义的环境。

定义奖励信号

创建奖励信号,以衡量代理人在实现目标方面的成功程度。

加载预定义的Simulink环境万博1manbetx

您可以在预定义的Simulink模型中培训代理程序,用于该模型的操作,观察,奖励和动态。万博1manbetx

水箱加固学习环境模型

创建一个加强学习模拟环境,该环境包含RL代理块,代替坦克中的水位万博1manbetx的控制器。