主要内容

RlagentInitializatizationAptions

初始化强化学习代理的选项

描述

使用RlagentInitializatizationAptions对象为代理指定初始化选项。要创建代理,请使用特定的代理创建功能,例如rlacagent

创建

描述

initopts= ragentInitializationAptions返回一个默认选项对象,以初始化支持默认网络的强化学习代理。万博1manbetx使用初始化选项来指定代理初始化参数,例如代理网络的每个隐藏层的单元数以及是否使用复发性神经网络。

例子

initopts= rlagentinitializationAptions(名称,价值创建一个初始化选项对象并设置其特性通过使用一个或多个名称值对参数。

特性

展开全部

除了在网络输出之前的完全连接的层(指定为正整数)之前,代理网络的每个隐藏完全连接的层中的单元数量。您设置的值也适用于任何LSTM层。

例子:'numhidendunit',64

标志使用复发性神经网络,指定为逻辑。

如果您设置Usernn真的,在代理创建过程中,软件将插入一个复发的LSTM层,其输出模式设置为在代理网络的输出路径中序列。政策梯度和参与者 - 批评者不支持复发性神经网络。万博1manbetx有关LSTM的更多信息,请参阅长期短期存储网络

例子:'usernn',是真的

对象功能

rlacagent 演员批判性强化学习者
rlpgagent 政策梯度加强学习代理
rlddpgagent 深层确定性政策梯度强化学习代理
rldqnagent 深Q网络加固学习代理
rlppoagent 近端政策优化强化学习代理
rltd3agent 双胞胎延迟的深层确定性政策梯度加强学习代理
rlsAcagent 软演员批判性的增强剂
rltrpoagent 信任区域政策优化强化学习代理

例子

全部收缩

创建代理初始化选项对象,指定隐藏神经元的数量并使用复发性神经网络。

initopts = rlagentInitializationAptions('numhidendunit',64,'usernn',真的)
initopts =带有属性的rlagentInitializationAptions:numhidendunit:64 usernn:1

您可以使用点表示法修改选项。例如,将代理样本时间设置为0.5

initopts.numhidendunit = 128
initopts =带有属性的rlagentInitializatizatizAptions:numhidendunit:128 usernn:1

版本历史记录

在R2020b中引入