主要内容

rlPredefinedEnv

创建一个预定义的强化学习的环境

自从R2019a

描述

例子

env= rlPredefinedEnv (关键字)需要一个预定义的关键字关键字代表环境的名称来创建一个MATLAB®或仿真万博1manbetx软件®强化学习环境env。环境env模型的动态代理进行交互,产生回报和观察代理人的行为的反应。

例子

全部折叠

使用预定义的“BasicGridWorld”关键字来创建一个基本的网格世界强化学习环境。

env = rlPredefinedEnv (“BasicGridWorld”)
env = rlMDPEnv属性:模型:[1 x1 rl.env。GridWorld] ResetFcn: []

使用预定义的“DoubleIntegrator-Continuous”关键字来创建一个连续的双积分器强化学习环境。

env = rlPredefinedEnv (“DoubleIntegrator-Continuous”)
env = DoubleIntegratorContinuousAction属性:增加:1 Ts: 0.1000 MaxDistance: 5 GoalThreshold: 0.0100问:[2 x2双]R: 0.0100 MaxForce:正状态:[2 x1双)

你可以想象环境使用情节功能和与它交互使用重置一步功能。

情节(env)观察=重置(env)
观察=2×14 0
(观察、奖励、结束)=步骤(env, 16)

图双积分器可视化工具包含一个坐标轴对象。坐标轴对象包含一个类型的对象的矩形。

观察=2×14.0800 - 1.6000
奖励= -16.5559
结束=逻辑0

使用预定义的“SimplePendulumModel-Continuous”关键字来创建一个连续的单摆模型强化学习环境。

env = rlPredefinedEnv (“SimplePendulumModel-Continuous”)
env = 万博1manbetxSimulinkEnvWithAgent属性:模型:rlSimplePendulumModel AgentBlock: rlSimplePendulumModel / RL代理ResetFcn: [] UseFastRestart:

输入参数

全部折叠

预定义关键字代表环境名称,指定为以下之一:

MATLAB环境

  • “BasicGridWorld”

  • “CartPole-Discrete”

  • “CartPole-Continuous”

  • “DoubleIntegrator-Discrete”

  • “DoubleIntegrator-Continuous”

  • “SimplePendulumWithImage-Discrete”

  • “SimplePendulumWithImage-Continuous”

  • “WaterFallGridWorld-Stochastic”

  • “WaterFallGridWorld-Deterministic”

万博1manbetx环境

  • “SimplePendulumModel-Discrete”

  • “SimplePendulumModel-Continuous”

  • “CartPoleSimscapeModel-Discrete”

  • “CartPoleSimscapeModel-Continuous”

输出参数

全部折叠

MATLAB和Sim万博1manbetxulink仿真环境对象,返回的是下列之一:

  • rlMDPEnv对象,当你使用下面的关键词之一。

    • “BasicGridWorld”

    • “WaterFallGridWorld-Stochastic”

    • “WaterFallGridWorld-Deterministic”

  • CartPoleDiscreteAction对象,当你使用“CartPole-Discrete”关键字。

  • CartPoleContinuousAction对象,当你使用“CartPole-Continuous”关键字。

  • DoubleIntegratorDiscreteAction对象,当你使用“DoubleIntegrator-Discrete”关键字。

  • DoubleIntegratorContinuousAction对象,当你使用“DoubleIntegrator-Continuous”关键字。

  • SimplePendlumWithImageDiscreteAction对象,当你使用“SimplePendulumWithImage-Discrete”关键字。

  • SimplePendlumWithImageContinuousAction对象,当你使用“SimplePendulumWithImage-Continuous”关键字。

  • 万博1manbetxSimulinkEnvWithAgent对象,当你使用下面的关键词之一。

    • “SimplePendulumModel-Discrete”

    • “SimplePendulumModel-Continuous”

    • “CartPoleSimscapeModel-Discrete”

    • “CartPoleSimscapeModel-Continuous”

版本历史

介绍了R2019a