getActionInfo

从强化学习环境或代理获取动作数据规范

全部折叠在页面中

语法

actInfo = getActionInfo (env)

actInfo = getActionInfo(代理)

描述

例子

actInfo= getActionInfo (env)从强化学习环境中提取动作信息env。

actInfo= getActionInfo (代理)从强化学习代理中提取动作信息代理。

例子

全部折叠

从强化学习环境的行动中提取和观测信息

开立真实脚本

提取可用于创建其他环境或代理的操作和观察信息。

这个例子的强化学习环境是简单的自我车和引车的纵向动力学。训练目标是通过控制纵向加速度(和刹车)，使小我车以设定的速度行驶，同时与前车保持安全距离。此示例使用与自适应巡航控制系统使用模型预测控制(模型预测控制工具箱)例子。

打开模型，创建强化学习环境。

mdl =“rlACCMdl”;open_system (mdl);agentblk = [mdl' / RL代理'];创建观察信息obsInfo = rlNumericSpec（[3 1]，“LowerLimit”负无穷*的(1),“UpperLimit”,正* (3,1));obsInfo。Name =“观察”;obsInfo。描述="关于速度误差和自我速度的信息";%的动作信息actInfo = rlNumericSpec([11]，“LowerLimit”，-3，“UpperLimit”2);actInfo。Name =“加速”;％定义环境env = rl万博1manbetxSimulinkEnv (mdl agentblk、obsInfo actInfo)

属性:Mod万博1manbetxel: "rlACCMdl" AgentBlock: "rlACCMdl/RL Agent" ResetFcn: [] UseFastRestart: 'on'

加强学习环境env是一个万博1manbetxSimulinkWithAgent与上述属性对象。

从强化学习环境中提取动作和观察信息env。

actInfoExt = getActionInfo (env)

Name: "加速度"描述:[0x0字符串]维度:[11 1]数据类型:"double"

obsInfoExt = getObservationInfo (env)

obsInfoExt = rlNumericSpec与属性：假定下限：[3X1双] UpperLimit用户：[3X1双]名称： “观察” 描述： “上速度误差和自我速度信息” 尺寸：[3 1]数据类型： “双”

动作信息包含加速度值，观察信息包含自我车辆的速度和速度误差值。

输入参数

全部折叠

`env`- - - - - -强化学习环境
`万博1manbetxSimulinkEnvWithAgent`对象

需要从中提取动作信息的强化学习环境，指定为万博1manbetxSimulinkEnvWithAgent宾语。

有关强化学习环境的更多信息，请参见创建强化学习的万博1manbetxSimulink环境。

`代理`- - - - - -强化学习代理
`rlQAgent`对象|`rlSARSAAgent`对象|`rlDQNAgent`对象|`rlDDPGAgent`对象|`rlPGAgent`对象|`rlACAgent`对象

必须从中提取动作信息的强化学习agent，指定为以下对象之一:

有关强化学习代理的详细信息，请参阅强化学习代理。

输出参数

全部折叠

`actInfo`-行动数据规格
的数组`rlNumericSpec`对象的|数组`rlFiniteSetSpec`对象

从钢筋学习环境中提取的动作数据规范，作为下列数组之一返回:

另请参阅

主题

介绍了R2019a

强化学习工具箱文档

万博1manbetx

尝试MATLAB、Sim万博1manbetxulink和其他产品s manbetx 845

得到审判现在

getActionInfo

语法

描述

例子

从强化学习环境的行动中提取和观测信息

输入参数

env- - - - - -强化学习环境万博1manbetxSimulinkEnvWithAgent对象

代理- - - - - -强化学习代理rlQAgent对象|rlSARSAAgent对象|rlDQNAgent对象|rlDDPGAgent对象|rlPGAgent对象|rlACAgent对象

输出参数

actInfo-行动数据规格的数组rlNumericSpec对象的|数组rlFiniteSetSpec对象

另请参阅

主题

介绍了R2019a

强化学习工具箱文档

万博1manbetx

尝试MATLAB、Sim万博1manbetxulink和其他产品s manbetx 845

`env`- - - - - -强化学习环境
`万博1manbetxSimulinkEnvWithAgent`对象

`代理`- - - - - -强化学习代理
`rlQAgent`对象|`rlSARSAAgent`对象|`rlDQNAgent`对象|`rlDDPGAgent`对象|`rlPGAgent`对象|`rlACAgent`对象

`actInfo`-行动数据规格
的数组`rlNumericSpec`对象的|数组`rlFiniteSetSpec`对象