获取观测信息

从强化学习环境或代理获取观察数据规范

折叠所有页面

语法

obsInfo=getObservationInfo（环境）

obsInfo=getObservationInfo（代理）

描述

实例

obsInfo=getObservationInfo(环境)从强化学习环境中提取观察信息环境.

obsInfo=getObservationInfo(代理人)从强化学习代理中提取观察信息代理人.

例子

全部崩溃

从强化学习环境中提取行动和观察信息

打开实时脚本

提取可用于创建其他环境或代理的操作和观察信息。

本示例中的强化学习环境是ego car和lead car的简单纵向动力学。培训目标是通过控制纵向加速度（和制动），使ego car以设定速度行驶，同时保持与lead car的安全距离。本示例使用与基于模型预测控制的自适应巡航控制系统（模型预测控制工具箱）实例

打开模型并创建强化学习环境。

mdl=“rlACCMdl”; 开放式系统（mdl）；agentblk=[mdl“/RL代理”];%创建观察信息obsInfo=rlNumericSpec（[3 1]，“LowerLimit”，-inf*one（3,1），“上限”，inf*one（3,1））；obsInfo.Name=“观察”; obsInfo.Description=“速度误差和速度信息”;%行动信息actInfo=rlNumericSpec（[1]，“LowerLimit”,-3,“上限”,2); actInfo.Name=“加速”;%定义环境env=rlSi万博1manbetxmulinkEnv（mdl、agentblk、obsInfo、actInfo）

env=Si万博1manbetxmulinkEnvWithAgent，属性为：模型：rlACCMdl AgentBlock:rlACCMdl/RL Agent ResetFcn:[]使用快速重启：打开

强化学习环境环境是一个万博1manbetx模拟代理具有上述属性的对象。

从强化学习环境中提取行动和观察信息环境.

actInfoExt=getActionInfo（环境）

ActionFoText=rlNumericSpec，属性：LowerLimit:-3上限：2名称：“加速度”说明：[0x0字符串]维度：[1]数据类型：“双”

obsInfoExt=getObservationInfo（env）

obsInfoExt=rlNumericSpec，属性为：LowerLimit:[3x1 double]上限：[3x1 double]名称：“观测值”说明：“速度误差和自我速度信息”维度：[3 1]数据类型：“double”

动作信息包含加速度值，而观察信息包含车辆的速度和速度误差值。

输入参数

全部崩溃

`环境`—强化学习环境
`万博1manbetx与代理同步`对象

强化学习环境，必须从中提取观察信息，指定为万博1manbetx与代理同步对象

有关强化学习环境的更多信息，请参阅为强化学习创建万博1manbetxSimulink环境.

`代理人`—强化学习代理
`rlQAgent`对象|`萨金特`对象|`rlDQNAgent`对象|`RLDDPG试剂`对象|`rlPGAgent`对象|`拉卡金特`对象

必须从中提取观察信息的强化学习代理，指定为以下对象之一：

有关强化学习代理的更多信息，请参阅强化学习代理.

输出参数

全部崩溃

`obsInfo`-观测数据规格
一系列`rlNumericSpec`对象|数组`rlFiniteSetSpec`物体

从强化学习环境中提取的观察数据规范，作为以下内容之一的数组返回：

另见

话题

在R2019a中引入

强化学习工具箱文档

万博1manbetx

试试MATLAB、Sim万博1manbetxulink和其他产品s manbetx 845

现在受审

获取观测信息

语法

描述

例子

从强化学习环境中提取行动和观察信息

输入参数

环境—强化学习环境万博1manbetx与代理同步对象

代理人—强化学习代理rlQAgent对象|萨金特对象|rlDQNAgent对象|RLDDPG试剂对象|rlPGAgent对象|拉卡金特对象

输出参数

obsInfo-观测数据规格一系列rlNumericSpec对象|数组rlFiniteSetSpec物体

另见

话题

强化学习工具箱文档

万博1manbetx

试试MATLAB、Sim万博1manbetxulink和其他产品s manbetx 845

`环境`—强化学习环境
`万博1manbetx与代理同步`对象

`代理人`—强化学习代理
`rlQAgent`对象|`萨金特`对象|`rlDQNAgent`对象|`RLDDPG试剂`对象|`rlPGAgent`对象|`拉卡金特`对象

`obsInfo`-观测数据规格
一系列`rlNumericSpec`对象|数组`rlFiniteSetSpec`物体