主要内容

RlsimulationOptions.

在环境中模拟强化学习代理的选项

描述

用A.RlsimulationOptions.对象指定用于在环境中模拟增强学习代理的仿真选项。执行模拟,使用SIM

有关代理培训和仿真的更多信息,请参阅火车加固学习代理

创建

描述

模拟= rlsimulation选项返回针对代理商模拟增强学习环境的默认选项。使用模拟选项指定有关模拟的参数,例如运行每个模拟的最大步数以及要运行的模拟数量。配置选项后,使用模拟作为输入参数SIM

例子

选择= rlsimulation选项(名称,价值创建使用指定的模拟选项特性使用一个或多个名称值对参数。

特性

展开全部

运行模拟的步数,指定为逗号分隔的配对'maxsteps'和一个正整数。通常,您在环境中定义剧集终端条件。如果不满足这些终止条件,则此值是在模拟中运行的最大步数。

例子:'maxsteps',1000

要运行的仿真数量,指定为逗号分隔对组成'numsimulations'和一个正整数。在每个模拟开始时,SIM重置环境。您可以在创建环境时指定环境重置时发生的情况。例如,如果配置环境,则重置每个剧集开始时的环境可以包括随机化初始状态值。在这种情况下,运行多个模拟允许您在一系列初始条件下验证培训的代理的性能。

例子:'numsimulations',10

当发生错误时停止模拟,指定为“离开”要么“在”。当这个选项是“离开”,错误被捕获并返回模拟杂志输出SIM并且仿真继续。

使用并行模拟的标志,指定为a逻辑。将此选项设置为真的配置模拟以使用并行处理来模拟环境,从而能够使用多个核,处理器,计算机集群或云资源来加速模拟。要指定并行模拟选项,请使用并行化选项财产。

请注意,如果要使用本地GPU加速深度神经网络计算(例如梯度计算,参数更新和预测),则无需设置使用指α.为真。相反,在创建演员或批评者表示时,使用rlrepresentationOptions.其中的对象umussevice.选项设置为“GPU”

使用并行计算或GPU需要并行计算工具箱™软件。另外使用计算机集群或云资源马铃薯®并行服务器™

有关使用多核处理器和GPU的培训的更多信息,请参阅使用并行计算和GPU的火车代理

例子:'使用反应',真实

并行化选项来控制并行模拟,指定为a平行训练目的。有关使用并行计算的培训的更多信息,请参阅火车加固学习代理

平行训练对象具有以下属性,您可以在创建后使用点表示法修改rltringOptions.目的。

Worker的Arganizer初始化,指定为以下一个:

  • -1- 为每个工人分配一个独特的随机种子。种子的价值是工人ID。

  • -2- 请勿将随机种子分配给工人。

  • 矢量 - 手动指定每项工作的随机种子。矢量中的元素数必须与工人数量相匹配。

将模型和工作区变量发送到并行工人,指定为“在”要么“离开”。When the option is“在”,主机将在模型中使用的变量并在基础MATLAB工作区中定义为工人。

附加到并行池的其他文件,指定为字符串或字符串数​​组。

在模拟开始之前运行的功能,指定为函数的句柄,该函数没有输入参数。在仿真开始之前,此函数每人运行一次。写入此函数以在模拟之前执行您需要的任何处理。

仿真结束后运行的功能,指定为函数的句柄,该函数没有输入参数。您可以编写此功能以清理工作区或在仿真终止后执行其他处理。

对象功能

SIM 在指定环境中模拟培训的钢筋学习代理

例子

全部收缩

创建一个用于模拟强化学习环境的选项。设置模拟到1000的步数,并配置运行三个模拟的选项。

您可以使用名称,在创建选项集时使用名称设置选项。您未明确设置的任何选项都具有其默认值。

Simopts = RlsimulationOptions(......'maxsteps',1000,......'numsimulations'3,3)
SIMOPTS =具有属性的RLSimulationOptions:MaxSteps:1000个NumSimulations:3 stoponError:“开启”使用指平行:0并行化选项:[1x1 rl.option.parallelsimulation]

或者,创建默认选项集并使用点表示法来更改一些值。

Simopts = RlsimulationOptions;simopts.maxsteps = 1000;simopts.numsimulations = 3;模拟
SIMOPTS =具有属性的RLSimulationOptions:MaxSteps:1000个NumSimulations:3 stoponError:“开启”使用指平行:0并行化选项:[1x1 rl.option.parallelsimulation]

也可以看看

在R2019A介绍