帮助中心帮助中心

万博1manbetx环境

使用Simulink模型增强学习环境动态万博1manbetx^®楷模

在强化学习方案中，环境对代理相互作用的动力学建模。环境：

收到代理商的行动
由环境模型的动态行为产生的观察结果
产生奖励，以衡量行动有助于完成任务的能力

您可以使用Simulink模型创建预定义和自定义环境。万博1manbetx有关更多信息，请参阅创建Simul万博1manbetxink增强学习环境。

功能

Environment Creation

`rlpredefinedenv`	创建预定义的增强学习环境
`rl万博1manbetxsimulinkenv`	使用实施的动态模型创建强化学习环境万博1manbetx
`Create IntegratedEnv`	创造万博1manbetx增强学习的模型，使用参考模型作为环境
`验证环境`	验证自定义增强学习环境
`SimulinkEnvWithAgent`	强化学习环境，采用动态模型万博1manbetx

奖励计算

`generatewardwardfunction`	从控制规格中产生奖励功能，以训练加强学习代理
`外部`	相对于有限区域的点的外部罚款值
`双曲线苯甲酸`	相对于有限区域的点的双曲线罚值
`壁垒`	相对于有界区域的对数屏障罚值

环境接口

`rlfinitesetspec`	为增强学习环境创建离散的动作或观察数据规范
`rlnumericspec`	为增强学习环境创建连续的动作或观察数据规范
`getActioninfo`	从强化学习环境或代理中获取行动数据规格
`GetObservationinfo`	从增强学习环境或代理中获取观察数据规格
`BUS2RLSPEC`	为一个元素创建强化学习数据规范万博1manbetx公共汽车

重置环境

`重置`	重置环境，代理，体验缓冲或策略对象

块

强化学习代理

话题

创建Simul万博1manbetxink增强学习环境
使用Simulink模型与代理相互作用，生成奖励和观察结果，以响应代理万博1manbetx操作。
为增强学习设计万博1manbetx师创建模拟环境
导入自定义模拟环境或创建预定义的万博1manbetxSimulink环境。
定义奖励信号
创建一个奖励信号，以衡量代理商在实现其目标方面的成功。
加载预定义的Simulink环境万博1manbetx
加载预定义的Simulink控制万博1manbetx系统环境。
水箱加固学习环境模型
创造a reinforcement learning Simulink environment that contains an RL Agent block in place of a controller for the water level in a tank.