getActionInfo

从强化学习环境或代理获取动作数据规范

描述

例子

actInfo= getActionInfo (env)从强化学习环境中提取动作信息env

actInfo= getActionInfo (代理)从强化学习代理中提取动作信息代理

例子

全部折叠

提取可用于创建其他环境或代理的操作和观察信息。

这个例子的强化学习环境是简单的自我车和引车的纵向动力学。训练目标是通过控制纵向加速度(和刹车),使小我车以设定的速度行驶,同时与前车保持安全距离。此示例使用与自适应巡航控制系统使用模型预测控制(模型预测控制工具箱)例子。

打开模型,创建强化学习环境。

mdl =“rlACCMdl”;open_system (mdl);agentblk = [mdl' / RL代理'];创建观察信息obsInfo = rlNumericSpec([3 1],“LowerLimit”负无穷*的(1),“UpperLimit”,正* (3,1));obsInfo。Name =“观察”;obsInfo。描述="关于速度误差和自我速度的信息";%的动作信息actInfo = rlNumericSpec([11],“LowerLimit”,-3,“UpperLimit”2);actInfo。Name =“加速”;%定义环境env = rl万博1manbetxSimulinkEnv (mdl agentblk、obsInfo actInfo)
属性:Mod万博1manbetxel: "rlACCMdl" AgentBlock: "rlACCMdl/RL Agent" ResetFcn: [] UseFastRestart: 'on'

加强学习环境env是一个万博1manbetxSimulinkWithAgent与上述属性对象。

从强化学习环境中提取动作和观察信息env

actInfoExt = getActionInfo (env)
Name: "加速度"描述:[0x0字符串]维度:[11 1]数据类型:"double"
obsInfoExt = getObservationInfo (env)
obsInfoExt = rlNumericSpec与属性:假定下限:[3X1双] UpperLimit用户:[3X1双]名称: “观察” 描述: “上速度误差和自我速度信息” 尺寸:[3 1]数据类型: “双”

动作信息包含加速度值,观察信息包含自我车辆的速度和速度误差值。

输入参数

全部折叠

需要从中提取动作信息的强化学习环境,指定为万博1manbetxSimulinkEnvWithAgent宾语。

有关强化学习环境的更多信息,请参见创建强化学习的万博1manbetxSimulink环境

必须从中提取动作信息的强化学习agent,指定为以下对象之一:

有关强化学习代理的详细信息,请参阅强化学习代理

输出参数

全部折叠

从钢筋学习环境中提取的动作数据规范,作为下列数组之一返回:

介绍了R2019a