RlsimulationOptions.

在环境中模拟强化学习代理的选项

展开所有页面

描述

用A.RlsimulationOptions.对象指定用于在环境中模拟增强学习代理的仿真选项。执行模拟，使用SIM。

有关代理培训和仿真的更多信息，请参阅火车加固学习代理。

创建

句法

Simopts = RlsimulationOptions.

opt = rlsimulation选项（名称，值）

描述

模拟= rlsimulation选项返回针对代理商模拟增强学习环境的默认选项。使用模拟选项指定有关模拟的参数，例如运行每个模拟的最大步数以及要运行的模拟数量。配置选项后，使用模拟作为输入参数SIM。

例子

选择= rlsimulation选项（名称，价值）创建使用指定的模拟选项特性使用一个或多个名称值对参数。

特性

展开全部

`maxsteps.`-运行模拟的步数
500.（默认）|正整数

运行模拟的步数，指定为逗号分隔的配对'maxsteps'和一个正整数。通常，您在环境中定义剧集终端条件。如果不满足这些终止条件，则此值是在模拟中运行的最大步数。

例子：'maxsteps'，1000

`numsimulations.`-模拟数量
1（默认）|正整数

要运行的仿真数量，指定为逗号分隔对组成'numsimulations'和一个正整数。在每个模拟开始时，SIM重置环境。您可以在创建环境时指定环境重置时发生的情况。例如，如果配置环境，则重置每个剧集开始时的环境可以包括随机化初始状态值。在这种情况下，运行多个模拟允许您在一系列初始条件下验证培训的代理的性能。

例子：'numsimulations'，10

`stoponerror.`-发生错误时停止仿真
`“在”`（默认）|`“离开”`

当发生错误时停止模拟，指定为“离开”要么“在”。当这个选项是“离开”，错误被捕获并返回模拟杂志输出SIM并且仿真继续。

`使用指α.`-使用并行仿真的标志
`错误的`（默认）|`真的`

使用并行模拟的标志，指定为a逻辑。将此选项设置为真的配置模拟以使用并行处理来模拟环境，从而能够使用多个核，处理器，计算机集群或云资源来加速模拟。要指定并行模拟选项，请使用并行化选项财产。

请注意，如果要使用本地GPU加速深度神经网络计算（例如梯度计算，参数更新和预测），则无需设置使用指α.为真。相反，在创建演员或批评者表示时，使用rlrepresentationOptions.其中的对象umussevice.选项设置为“GPU”。

使用并行计算或GPU需要并行计算工具箱™软件。另外使用计算机集群或云资源马铃薯^®并行服务器™。

有关使用多核处理器和GPU的培训的更多信息，请参阅使用并行计算和GPU的火车代理。

例子：'使用反应'，真实

`并行化选项`-控制并行仿真的选项
`平行训练`目的

并行化选项来控制并行模拟，指定为a平行训练目的。有关使用并行计算的培训的更多信息，请参阅火车加固学习代理。

这平行训练对象具有以下属性，您可以在创建后使用点表示法修改rltringOptions.目的。

`法兰苗豆蔻`- 工人初始化随机化
`-1`（默认）|`-2`|向量

Worker的Arganizer初始化，指定为以下一个：

-1- 为每个工人分配一个独特的随机种子。种子的价值是工人ID。
-2- 请勿将随机种子分配给工人。
矢量 - 手动指定每项工作的随机种子。矢量中的元素数必须与工人数量相匹配。

`TransferBaseWorkspaceVariables.`- 将模型和工作区变量发送到并行工人
`“在”`（默认）|`“离开”`

将模型和工作区变量发送到并行工人，指定为“在”要么“离开”。When the option is“在”，主机将在模型中使用的变量并在基础MATLAB工作区中定义为工人。

`附加的文件`- 附加到并行池的其他文件
`[]`（默认）|字符串|字符串数组

附加到并行池的其他文件，指定为字符串或字符串数组。

`setupfcn.`- 在仿真开始之前运行的功能
`[]`（默认）|功能手柄

在模拟开始之前运行的功能，指定为函数的句柄，该函数没有输入参数。在仿真开始之前，此函数每人运行一次。写入此函数以在模拟之前执行您需要的任何处理。

`Cleanupfcn.`- 仿真结束后运行的功能
`[]`（默认）|功能手柄

仿真结束后运行的功能，指定为函数的句柄，该函数没有输入参数。您可以编写此功能以清理工作区或在仿真终止后执行其他处理。

对象功能

SIM 在指定环境中模拟培训的钢筋学习代理

例子

全部收缩

配置模拟选项

打开直播脚本

创建一个用于模拟强化学习环境的选项。设置模拟到1000的步数，并配置运行三个模拟的选项。

您可以使用名称，在创建选项集时使用名称设置选项。您未明确设置的任何选项都具有其默认值。

Simopts = RlsimulationOptions（......'maxsteps'，1000，......'numsimulations'3，3）

SIMOPTS =具有属性的RLSimulationOptions：MaxSteps：1000个NumSimulations：3 stoponError：“开启”使用指平行：0并行化选项：[1x1 rl.option.parallelsimulation]

或者，创建默认选项集并使用点表示法来更改一些值。

Simopts = RlsimulationOptions;simopts.maxsteps = 1000;simopts.numsimulations = 3;模拟

SIMOPTS =具有属性的RLSimulationOptions：MaxSteps：1000个NumSimulations：3 stoponError：“开启”使用指平行：0并行化选项：[1x1 rl.option.parallelsimulation]

也可以看看

话题

加固学习代理人

在R2019A介绍

RlsimulationOptions.

描述

创建

句法

描述

特性

`maxsteps.`-运行模拟的步数
500.（默认）|正整数

`numsimulations.`-模拟数量
1（默认）|正整数

`stoponerror.`-发生错误时停止仿真
`“在”`（默认）|`“离开”`

`使用指α.`-使用并行仿真的标志
`错误的`（默认）|`真的`

`并行化选项`-控制并行仿真的选项
`平行训练`目的

`法兰苗豆蔻`- 工人初始化随机化
`-1`（默认）|`-2`|向量

`TransferBaseWorkspaceVariables.`- 将模型和工作区变量发送到并行工人
`“在”`（默认）|`“离开”`

`附加的文件`- 附加到并行池的其他文件
`[]`（默认）|字符串|字符串数组

`setupfcn.`- 在仿真开始之前运行的功能
`[]`（默认）|功能手柄

`Cleanupfcn.`- 仿真结束后运行的功能
`[]`（默认）|功能手柄

对象功能

例子

配置模拟选项

也可以看看

话题

强化学习工具箱文档

万博1manbetx

用Matlab和Simulink加强学习万博1manbetx

RlsimulationOptions.

描述

创建

句法

描述

特性

maxsteps.-运行模拟的步数500.（默认）|正整数

numsimulations.-模拟数量1（默认）|正整数

stoponerror.-发生错误时停止仿真“在”（默认）|“离开”

使用指α.-使用并行仿真的标志错误的（默认）|真的

并行化选项-控制并行仿真的选项平行训练目的

法兰苗豆蔻- 工人初始化随机化-1（默认）|-2|向量

TransferBaseWorkspaceVariables.- 将模型和工作区变量发送到并行工人“在”（默认）|“离开”

附加的文件- 附加到并行池的其他文件[]（默认）|字符串|字符串数组

setupfcn.- 在仿真开始之前运行的功能[]（默认）|功能手柄

Cleanupfcn.- 仿真结束后运行的功能[]（默认）|功能手柄

对象功能

例子

配置模拟选项

也可以看看

话题

强化学习工具箱文档

万博1manbetx

用Matlab和Simulink加强学习万博1manbetx

`maxsteps.`-运行模拟的步数
500.（默认）|正整数

`numsimulations.`-模拟数量
1（默认）|正整数

`stoponerror.`-发生错误时停止仿真
`“在”`（默认）|`“离开”`

`使用指α.`-使用并行仿真的标志
`错误的`（默认）|`真的`

`并行化选项`-控制并行仿真的选项
`平行训练`目的

`法兰苗豆蔻`- 工人初始化随机化
`-1`（默认）|`-2`|向量

`TransferBaseWorkspaceVariables.`- 将模型和工作区变量发送到并行工人
`“在”`（默认）|`“离开”`

`附加的文件`- 附加到并行池的其他文件
`[]`（默认）|字符串|字符串数组

`setupfcn.`- 在仿真开始之前运行的功能
`[]`（默认）|功能手柄

`Cleanupfcn.`- 仿真结束后运行的功能
`[]`（默认）|功能手柄