主要内容

万博1manbetx环境

使用Simulink模型增强学习环境动态万博1manbetx®楷模

在强化学习方案中,环境对代理相互作用的动力学建模。环境:

  1. 收到代理商的行动

  2. 由环境模型的动态行为产生的观察结果

  3. 产生奖励,以衡量行动有助于完成任务的能力

您可以使用Simulink模型创建预定义和自定义环境。万博1manbetx有关更多信息,请参阅创建Simul万博1manbetxink增强学习环境

功能

展开全部

rlpredefinedenv 创建预定义的增强学习环境
rl万博1manbetxsimulinkenv 使用实施的动态模型创建强化学习环境万博1manbetx
Create IntegratedEnv 创造万博1manbetx增强学习的模型,使用参考模型作为环境
验证环境 验证自定义增强学习环境
SimulinkEnvWithAgent 强化学习环境,采用动态模型万博1manbetx
generatewardwardfunction 从控制规格中产生奖励功能,以训练加强学习代理
外部 相对于有限区域的点的外部罚款值
双曲线苯甲酸 相对于有限区域的点的双曲线罚值
壁垒 相对于有界区域的对数屏障罚值
rlfinitesetspec 为增强学习环境创建离散的动作或观察数据规范
rlnumericspec 为增强学习环境创建连续的动作或观察数据规范
getActioninfo 从强化学习环境或代理中获取行动数据规格
GetObservationinfo 从增强学习环境或代理中获取观察数据规格
BUS2RLSPEC 为一个元素创建强化学习数据规范万博1manbetx公共汽车
重置 重置环境,代理,体验缓冲或策略对象

RL代理 强化学习代理

话题