rlNumericSpec

为强化学习环境创建连续的动作或观察数据规范

在页面中展开所有内容

描述

一个rlNumericSpec对象指定用于增强学习环境的连续操作或观测数据规范。

创建

语法

规范= rlNumericSpec(维度)

规范= rlNumericSpec(尺寸、名称、值)

描述

例子

规范= rlNumericSpec (尺寸)为连续操作或观察创建数据规范，并设置维财产。

规范= rlNumericSpec (尺寸,名称,值)集属性使用名称-值对参数。

属性

全部展开

`假定下限`- - - - - -数据空间的下限
`“负”`(默认)|标量|矩阵

数据空间的下限，指定为与数据空间大小相同的标量或矩阵。当假定下限指定为标量，rlNumericSpec它适用于数据空间中的所有条目。

`UpperLimit`- - - - - -数据空间的上限
`“正”`(默认)|标量|矩阵

数据空间的上限，指定为与数据空间大小相同的标量或矩阵。当UpperLimit指定为标量，rlNumericSpec它适用于数据空间中的所有条目。

`的名字`- - - - - -的名称`rlNumericSpec`对象
字符串(默认)

的名称rlNumericSpec对象，指定为字符串。

`描述`- - - - - -的描述`rlNumericSpec`对象
字符串(默认)

的描述rlNumericSpec对象，指定为字符串。

`维`- - - - - -数据空间的维度
数值向量(默认)

此属性是只读的。

数据空间的尺寸，指定为数值向量。

`数据类型`- - - - - -有关数据类型的信息
字符串(默认)

此属性是只读的。

有关数据类型的信息，指定为字符串。

对象的功能

`rl万博1manbetxSimulinkEnv`	创建使用中实现动态模型的增强学习环境万博1manbetx
`rlFunctionEnv`	使用函数指定自定义强化学习环境动态
`rlRepresentation`	(不推荐)用于增强学习代理的模型表示

例子

全部折叠

增强Simulink模型的学习环境万博1manbetx

这个示例使用:

开立真实脚本

对于本例，考虑rlSimplePendulumModel万博1manbetx仿真软件模型。该模型是一个简单的无摩擦摆，最初是挂在向下的位置。

打开模型。

mdl ='rlSimplePendulumModel';open_system (mdl)

分配代理块路径信息，并创建rlNumericSpec和rlFiniteSetSpec对象为观察和动作信息。可以使用点符号来分配属性值rlNumericSpec和rlFiniteSetSpec对象。

agentBlk = [MDL' / RL代理'];obsInfo = rlNumericSpec([3 1])

Inf Name: [0x0 string]描述:[0x0 string]维度:[3 1]数据类型:"double"

actInfo = rlFiniteSetSpec([2 1])

Name: [0x0字符串]Description: [0x0字符串]维度:[11 1]数据类型:"double"

obsInfo。Name =“观察”;actInfo。Name =“扭矩”;

使用前面步骤中提取的信息为Simulink模型创建增强学习环境。万博1manbetx

env = rl万博1manbetxSimulinkEnv (mdl agentBlk、obsInfo actInfo)

ENV = 万博1manbetxSimulinkEnvWithAgent具有属性：型号： “rlSimplePendulumModel” AgentBlock： “rlSimplePendulumModel / RL代理” ResetFcn：[] UseFastRestart： '接通'

还可以使用点符号包含一个reset函数。对于本例，考虑随机初始化theta0在模型工作区中。

env。ResetFcn = @(in) setVariable(in，'theta0'randn,“工作区”，MDL）

ENV = 万博1manbetxSimulinkEnvWithAgent具有属性：型号： “rlSimplePendulumModel” AgentBlock： “rlSimplePendulumModel / RL代理” ResetFcn：@（在）setVariable（在 'theta0'，randn， '工作区'，MDL）UseFastRestart： '接通'