文件帮助中心文件
在环境中模拟强化学习代理的选项
用A.RlsimulationOptions.对象指定用于在环境中模拟增强学习代理的仿真选项。执行模拟,使用SIM。
RlsimulationOptions.
SIM
有关代理培训和仿真的更多信息,请参阅火车加固学习代理。
Simopts = RlsimulationOptions.
opt = rlsimulation选项(名称,值)
模拟= rlsimulation选项返回针对代理商模拟增强学习环境的默认选项。使用模拟选项指定有关模拟的参数,例如运行每个模拟的最大步数以及要运行的模拟数量。配置选项后,使用模拟作为输入参数SIM。
模拟= rlsimulation选项
模拟
例子
选择= rlsimulation选项(名称,价值)创建使用指定的模拟选项特性使用一个或多个名称值对参数。
选择= rlsimulation选项(名称,价值)
选择
名称,价值
展开全部
maxsteps.
运行模拟的步数,指定为逗号分隔的配对'maxsteps'和一个正整数。通常,您在环境中定义剧集终端条件。如果不满足这些终止条件,则此值是在模拟中运行的最大步数。
'maxsteps'
例子:'maxsteps',1000
'maxsteps',1000
numsimulations.
要运行的仿真数量,指定为逗号分隔对组成'numsimulations'和一个正整数。在每个模拟开始时,SIM重置环境。您可以在创建环境时指定环境重置时发生的情况。例如,如果配置环境,则重置每个剧集开始时的环境可以包括随机化初始状态值。在这种情况下,运行多个模拟允许您在一系列初始条件下验证培训的代理的性能。
'numsimulations'
例子:'numsimulations',10
'numsimulations',10
stoponerror.
“在”
“离开”
当发生错误时停止模拟,指定为“离开”要么“在”。当这个选项是“离开”,错误被捕获并返回模拟杂志输出SIM并且仿真继续。
模拟杂志
使用指α.
错误的
真的
使用并行模拟的标志,指定为a逻辑。将此选项设置为真的配置模拟以使用并行处理来模拟环境,从而能够使用多个核,处理器,计算机集群或云资源来加速模拟。要指定并行模拟选项,请使用并行化选项财产。
逻辑
并行化选项
请注意,如果要使用本地GPU加速深度神经网络计算(例如梯度计算,参数更新和预测),则无需设置使用指α.为真。相反,在创建演员或批评者表示时,使用rlrepresentationOptions.其中的对象umussevice.选项设置为“GPU”。
rlrepresentationOptions.
umussevice.
“GPU”
使用并行计算或GPU需要并行计算工具箱™软件。另外使用计算机集群或云资源马铃薯®并行服务器™。
有关使用多核处理器和GPU的培训的更多信息,请参阅使用并行计算和GPU的火车代理。
例子:'使用反应',真实
'使用反应',真实
平行训练
并行化选项来控制并行模拟,指定为a平行训练目的。有关使用并行计算的培训的更多信息,请参阅火车加固学习代理。
这平行训练对象具有以下属性,您可以在创建后使用点表示法修改rltringOptions.目的。
rltringOptions.
法兰苗豆蔻
-1
-2
Worker的Arganizer初始化,指定为以下一个:
-1- 为每个工人分配一个独特的随机种子。种子的价值是工人ID。
-2- 请勿将随机种子分配给工人。
矢量 - 手动指定每项工作的随机种子。矢量中的元素数必须与工人数量相匹配。
TransferBaseWorkspaceVariables.
将模型和工作区变量发送到并行工人,指定为“在”要么“离开”。When the option is“在”,主机将在模型中使用的变量并在基础MATLAB工作区中定义为工人。
附加的文件
[]
附加到并行池的其他文件,指定为字符串或字符串数组。
setupfcn.
在模拟开始之前运行的功能,指定为函数的句柄,该函数没有输入参数。在仿真开始之前,此函数每人运行一次。写入此函数以在模拟之前执行您需要的任何处理。
Cleanupfcn.
仿真结束后运行的功能,指定为函数的句柄,该函数没有输入参数。您可以编写此功能以清理工作区或在仿真终止后执行其他处理。
全部收缩
创建一个用于模拟强化学习环境的选项。设置模拟到1000的步数,并配置运行三个模拟的选项。
您可以使用名称,在创建选项集时使用名称设置选项。您未明确设置的任何选项都具有其默认值。
Simopts = RlsimulationOptions(......'maxsteps',1000,......'numsimulations'3,3)
SIMOPTS =具有属性的RLSimulationOptions:MaxSteps:1000个NumSimulations:3 stoponError:“开启”使用指平行:0并行化选项:[1x1 rl.option.parallelsimulation]
或者,创建默认选项集并使用点表示法来更改一些值。
Simopts = RlsimulationOptions;simopts.maxsteps = 1000;simopts.numsimulations = 3;模拟
您有此示例的修改版本。您是否希望使用您的编辑打开此示例?
您单击了与此MATLAB命令对应的链接:
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站,以便在可用的地方进行翻译的内容,并查看本地活动和优惠。根据您的位置,我们建议您选择:。
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。
联系您当地的办公室